> 资讯 > > 内容页

每日资讯:可灵AI发布O1视频大模型 支持多模态输入与对话式编辑

来源: 网易科技报道 2025-12-02 10:25:57


(资料图片仅供参考)

12月2日消息,据了解,可灵AI于12月1日正式宣布,其自主研发的O1视频大模型正式面向公众全量开放。该模型被定位为一款统一的多模态创作工具,支持用户通过单一输入框融合文字、图像、视频指令进行视频生成与编辑。

据悉,可灵O1模型采用MVL(多模态视觉语言)统一交互架构,结合Chain-of-Thought推理技术,能够处理文生视频、图生视频、局部编辑、镜头延展等多种任务,无需在不同功能模块间切换。该技术通过多视角主体构建方法,旨在解决视频生成中人物或物体在镜头切换时出现的特征漂移问题,以提升画面连贯性。

目前,可灵O1模型已在可灵App及官网开放体验,支持生成3至10秒时长的视频,主要面向短视频创作者、广告团队及个人用户。公司表示后续将开放API接口,供第三方平台集成。(袁雪丽)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

关键词: 模态 可灵 输入框

Copyright   2015-2022 国际日报网版权所有  备案号: 豫ICP备2021032478号-45   联系邮箱:363 525 0558@qq.com