neng8科技快讯网AI人工智能前沿资讯_汽车数码相机评测_手机电脑硬件百科

VideoPrism – 谷歌研究团队推出的通用视频编码器

VideoPrism – 谷歌研究团队推出的通用视频编码器

VideoPrism是一个由谷歌研究团队开发的通用视频编码器,旨在通过一个单一的冻结模型来处理多种视频理解任务。该模型能够从视频中提取丰富的语义表示,使其能够在不同的视频理解任务中实现高性能和准确率,例如视频分类、定位、检索、描述生成和问答等。
19 0 2025-08-31
VideoPoet – 谷歌推出的AI视频生成模型

VideoPoet – 谷歌推出的AI视频生成模型

VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案,支持从文本、图像或视频输入中合成高质量的视频内容,并生成匹配的音频。VideoPoet的核心优势在于其多模态大模型的设计,无需特定数据集或扩散模型。
17 0 2025-08-31
VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架

VideoPainter – 港中文联合腾讯等机构推出的视频修复和编辑框架

VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专门用在处理任意长度的视频内容。VideoPainter基于双分支架构,结合轻量级上下文编码器和预训练的扩散模型,实现高效的背景保留和前景生成。
19 0 2025-08-31
VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架

VideoMaker – 浙大联合腾讯和华为推出的零样本定制视频生成框架

VideoMaker是浙江大学、腾讯和华为诺亚方舟实验室共同开发的创新项目,基于视频扩散模型(VDM)的零样本定制视频生成框架。与传统方法不同,VideoMaker无需额外模型即可直接从参考图片中提取和注入主题特征,实现个性化视频内容的一键生成。
19 0 2025-08-31
VideoLingo – 全自动AI视频翻译工具,一键搞定双语字幕和配音

VideoLingo – 全自动AI视频翻译工具,一键搞定双语字幕和配音

VideoLingo 是一款一键全自动视频翻译工具,能将视频进行字幕切割、翻译、对齐和配音,最终生成 Netflix 级别的字幕和配音。VideoLingo 基于自然语言处理(NLP)和大型语言模型(LLM)技术,提供智能术语知识库,实现上下文感知翻译。
19 0 2025-08-31
VideoLLaMB – 开源的多模态长视频理解框架

VideoLLaMB – 开源的多模态长视频理解框架

VideoLLaMB 是一种创新的长视频理解框架,通过引入记忆桥接层和递归记忆令牌来处理视频数据,确保在分析时不丢失关键视觉信息。模型特别设计用于理解长时间视频内容,保持语义连续性,并在多种任务中表现出色,如视频问答、自我中心规划和流式字幕生成。
21 0 2025-08-31
VideoLLaMA3 – 阿里达摩院推出的多模态基础模型

VideoLLaMA3 – 阿里达摩院推出的多模态基础模型

VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合了先进的视觉编码器(如 SigLip)和强大的语言生成能力,能高效处理长视频序列,支持多语言的视频内容分析和视觉问答任务。
21 0 2025-08-31
VideoJAM – Meta 推出增强视频生成模型运动连贯性的框架

VideoJAM – Meta 推出增强视频生成模型运动连贯性的框架

VideoJAM是Meta推出的,用在增强视频生成模型运动连贯性的框架。基于引入联合外观-运动表示,让模型在训练阶段同时学习预测视频的像素和运动信息,在推理阶段基于模型自身的运动预测作为动态引导信号,生成更连贯的运动。
20 0 2025-08-31
VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架

VideoGrain – 悉尼科技大学和浙大推出的视频编辑框架

VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架,能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自注意力机制,增强文本提示对目标区域的控制能力,且保持区域间的特征分离,解决现有扩散模型中语义错位和特征耦合的问题。
16 0 2025-08-31
VideoGigaGAN – Adobe推出的AI视频分辨率提升模型

VideoGigaGAN – Adobe推出的AI视频分辨率提升模型

VideoGigaGAN是由Adobe和马里兰大学的研究人员提出的一种新型的生成式视频超分辨率(VSR)模型,最高可将视频分辨率提升8倍,将模糊的视频放大为具有丰富细节和时间连贯性的高清视频。
17 0 2025-08-31
VideoDoodles – Adobe推出的AI视频编辑框架

VideoDoodles – Adobe推出的AI视频编辑框架

VideoDoodles是Adobe公司联合多所大学推出的AI视频编辑框架。支持用户在视频中轻松插入手绘动画,实现与视频内容的无缝融合。通过预处理视频帧,系统提供平面画布,用户可以视频上绘制动画,系统自动处理透视和遮挡效果。
25 0 2025-08-31