交流评论、关注点赞

  • Facebook Icon脸书专页
  • telegram Icon粉丝交流群
  • telegram Icon电报频道
  • RSS订阅禁闻RSS/FEED订阅

🤖 谷歌发布 Gemini Omni 模型,支持对话式视频编辑

2026年05月20日 14:00 PDF版 分享转发


thumb.jpeg?grouped_id=14233720022558313



thumb.jpeg?grouped_id=14233720022558313



thumb.jpeg?grouped_id=14233720022558313

🤖 发布 Omni 模型,支持对话式视频编辑

谷歌推出全新多模态模型 Gemini Omni,支持通过图像、音频及文本的混合输入来生成和编辑视频。用户能以自然语言对话的方式修改视频内容,例如调整物理效果、变换角色或改变角度。目前,首个型号 Gemini Omni Flash 已通过 Gemini 应用向 AI Plus、Pro 和 Ultra 订阅用户开放,并同步登陆 Google Flow、YouTube Shorts 和 YouTube Create App。

该模型具备对重力、等物理规律的直观理解,并能确保在多次编辑中保持角色的一致性。为了确保内容透明度,所有生成的视频都嵌入了 SynthID 数字水印。谷歌计划在未来几周向开发者开放 API,并逐步增加图像和音频的输出支持。

Google

🌸 在花频道 · 备用频道 · 投稿通道

请点赞转发分享👇👇👇Follow Us 责任编辑:周枫