neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

谷歌Gemini推出实时AI视频功能

谷歌Gemini推出实时AI视频功能

谷歌Gemini推出实时AI视频功能

谷歌发言人 Alex Joseph 在给The Verge的电子邮件中证实,谷歌已开始向 Gemini Live 推出新的 AI 功能,使其能够看到你的屏幕或通过你的智能手机摄像头回答有关实时问题。


这些功能是在谷歌首次展示为其提供支持的Project Astra工作近一年后推出的。


谷歌Gemini推出实时AI视频功能

22 0 2025-09-03
Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术

Generative Omnimatte – 谷歌联合马里兰大学等机构推出的视频分解技术

Generative Omnimatte 是 Google DeepMind 等机构推出的视频编辑技术,能将视频智能分解为多个透明背景的RGBA图层,每个图层对应一个物体及其相关效果(如阴影、反射等)。这项技术无需绿幕或深度信息,能实现物体与背景的精确分离,甚至处理被遮挡的部分。
23 0 2025-08-29
Gemini Embedding – 谷歌推出的文本嵌入模型

Gemini Embedding – 谷歌推出的文本嵌入模型

Gemini Embedding 是 Google 推出的先进的文本嵌入模型,基于将文本转化为高维数值向量,捕捉其语义和上下文信息。Gemini Embedding基于 Gemini 模型训练,具备强大的语言理解能力,支持超过100种语言,在多语言文本嵌入基准测试(MTEB)中排名第一。
26 0 2025-08-29
Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型

Gemini 2.0 – 谷歌推出的原生多模态输入输出 + Agent 为核心的AI模型

Gemini 2.0是谷歌最新推出的原生多模态输入输出的AI模型。Gemini 2.0 Flash是2.0家族第一个模型,以多模态输入输出和Agent技术为核心,速度比 1.5 Pro快两倍,关键性能指标超过 1.5 Pro。模型支持原生工具调用和实时音视频流输入,提供文本、音频和图像的集成响应,具备多语言音频输出能力。
25 0 2025-08-29