neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

谷歌Gemini推出实时AI视频功能

谷歌Gemini推出实时AI视频功能

谷歌Gemini推出实时AI视频功能

谷歌发言人 Alex Joseph 在给The Verge的电子邮件中证实,谷歌已开始向 Gemini Live 推出新的 AI 功能,使其能够看到你的屏幕或通过你的智能手机摄像头回答有关实时问题。


这些功能是在谷歌首次展示为其提供支持的Project Astra工作近一年后推出的。


谷歌Gemini推出实时AI视频功能

21 0 2025-09-03
Imagen 4 – 谷歌推出的最新图像生成AI模型

Imagen 4 – 谷歌推出的最新图像生成AI模型

Imagen 4是谷歌发布的最新图像生成AI模型。支持高达2K分辨率的图像生成,细节呈现逼真,可清晰呈现复杂织物纹理、水滴折射及动物毛发质感等。在文本渲染方面,Imagen 4也有重大突破,能生成清晰准确的文字,适合广告、漫画或邀请函等设计场景。
22 0 2025-08-29
Gemma 3n – 谷歌推出的端侧多模态AI模型

Gemma 3n – 谷歌推出的端侧多模态AI模型

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型。基于 Gemini Nano 架构,采用逐层嵌入技术,将内存占用压缩至 2-4B 参数模型水平。模型参数量分别为 5B 和 8B,内存占用仅相当于 2B 和 4B 模型。
19 0 2025-08-29
Gemini Embedding – 谷歌推出的文本嵌入模型

Gemini Embedding – 谷歌推出的文本嵌入模型

Gemini Embedding 是 Google 推出的先进的文本嵌入模型,基于将文本转化为高维数值向量,捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练,具备强大的语言理解能力,支持超过100种语言,在多语言文本嵌入基准测试(MTEB)中排名第一。
25 0 2025-08-29
Gemini Diffusion – 谷歌推出的文本扩散模型

Gemini Diffusion – 谷歌推出的文本扩散模型

Gemini Diffusion是谷歌推出的实验性文本扩散模型。与传统自回归模型逐词生成文本不同,基于逐步细化噪声生成输出,能快速迭代纠正错误,让Gemini Diffusion在文本生成任务中表现出色,具备快速响应、生成更连贯文本和迭代细化等能力。
21 0 2025-08-29
谷歌借助Gemini AI系统深化对机器人的训练

谷歌借助Gemini AI系统深化对机器人的训练

7月12日,国际科技界传来新动态,谷歌正借助其先进的Gemini AI系统,深化对旗下机器人的训练,旨在显著提升它们的导航能力和任务执行能力。DeepMind机器人团队最新发布的研究论文,详细阐述了如何利用Gemini 1.5 Pro的强化长上下文窗口功能,极大地优化了用户通过自然语言指令与RT-2机器人交互的体验。
23 0 2025-08-27