科技中国

AI
业界 手机 电脑 数码 智车 AI 苹果
当前位置: 首页 > AI > 正文

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

2024-12-18 17:11:15 来源:IT之家 A+A-

12 月 18 日消息,Meta 携手斯坦福大学,推出全新 AI 模型系列 Apollo,显著提升机器对视频的理解能力。

注:尽管人工智能在处理图像和文本方面取得了巨大进步,但让机器真正理解视频仍然是一个重大挑战。

视频包含复杂的动态信息,人工智能更难处理这些信息,不仅需要更多的计算能力,而且如何设计最佳 AI 视频解读系统,也存在诸多困难。

在视频处理方面,研究人员发现,保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件,一个处理单独的视频帧,而另一个跟踪对象和场景如何随时间变化。

此外,在处理后的视频片段之间添加时间戳,有助于模型理解视觉信息与文本描述之间的关系,保持时间感知。

在模型训练方面,团队研究表明训练方法比模型大小更重要。Apollo 模型采用分阶段训练,按顺序激活模型的不同部分,比一次性训练所有部分效果更好。

此外 Meta 公司还不断优化数据组合,发现 10~14% 的文本数据,其余部分略微偏向视频内容,可以更好地平衡语言理解和视频处理能力。

Apollo 模型在不同规模上均表现出色,较小的 Apollo-3B 超越了 Qwen2-VL 等同等规模的模型,而 Apollo-7B 超过更大参数的同类模型,Meta 已开源 Apollo 的代码和模型权重,并在 Hugging Face 平台提供公开演示。

参考

  • Meta's new Apollo models aim to crack the video understanding problem

  • Meta AI Releases Apollo: A New Family of Video-LMMs LARge Multimodal Models for Video Understanding

  • Apollo: An Exploration of Video Understanding in Large Multimodal Models

Tags:Meta
(责任编辑:Diy52)

推荐阅读 相关文章

字节跳动豆包电脑版上线视频生成功能,内测用户每日可免费生成十支视频

12 月 10 日消息,字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部...[详细]

2024-12-11 09:04:51

扎克伯格:Meta AI 全球月活跃用户逼近 6 亿

12 月 10 日消息,Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)于 3 天前在 Threa...[详细]

2024-12-11 09:04:51

ChatGPT 高级语音模式主创“自立门户”:新公司估值达 2 亿美元,打造有情感的 AI 语音交互

12 月 10 日消息,前 OpenAI 研究员 Alexis Conneau 最新创立 WaveForms AI,目前已获...[详细]

2024-12-11 09:04:51

和 DALL-E 交锋:X 向 Premium 用户开放 Aurora 文生图 AI 模型

12 月 10 日消息,科技媒体 testingcatalog 昨日(12 月 9 日)发布博文,报道称埃隆・马...[详细]

2024-12-11 09:04:51

Meta 推出 SPDL 工具:突破训练 AI 模型数据效率瓶颈,吞吐量提升 2-3 倍

12 月 10 日消息,训练 AI 模型的瓶颈,目前不再仅仅是架构设计,数据管理效率也至关重...[详细]

2024-12-11 09:04:51

苹果和欧盟博弈:点名 Meta,质疑 15 项 iPhone 数据访问请求暗藏隐私风险

12 月 19 日消息,欧盟委员会昨日(12 月 18 日)发布报告,向苹果公司施压,要求其进一步开...[详细]

2024-12-21 07:58:28

苹果指责 Meta 在欧盟 DMA 框架下提出过多互操作性请求,危及用户隐私安全

12 月 19 日消息,苹果公司今日表示,Meta 公司已在欧盟《数字市场法案》(DMA)框架下提...[详细]

2024-12-19 14:14:28

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

12 月 18 日消息,Meta 携手斯坦福大学,推出全新 AI 模型系列 Apollo,显著提升机器对...[详细]

2024-12-18 17:11:15

扎克伯格:Meta AI 全球月活跃用户逼近 6 亿

12 月 10 日消息,Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)于 3 天前在 Threa...[详细]

2024-12-11 09:04:51

Meta 推出 SPDL 工具:突破训练 AI 模型数据效率瓶颈,吞吐量提升 2-3 倍

12 月 10 日消息,训练 AI 模型的瓶颈,目前不再仅仅是架构设计,数据管理效率也至关重...[详细]

2024-12-11 09:04:51

联系方式