科技快讯:阿里发布万相2.6系列模型,国内首个角色扮演功能上线,支持音画同步

行业节点:视频生成从“单点能力”走向体系化
随着AI视频技术加速演进,行业竞争已从单一画面质量比拼,转向完整创作流程的能力整合。12月16日,阿里发布通义万相2.6系列模型,明确瞄准专业影视制作与高质量内容创作场景,标志着国内视频生成模型开始系统性解决“连续叙事”问题。

能力亮点:国内首个角色扮演视频模型
万相2.6的核心突破,在于其率先实现角色扮演能力的工程化落地。模型可参考输入视频中的人物形象与声音特征,在新生成的视频中保持角色外观、音色与行为的一致性。这一能力不仅适用于单人演绎,也支持多人互动及人与物体同框的复杂场景,为长链路视频生成奠定基础。

创作升级:多镜头与音画同步协同实现
在创作体验上,万相2.6将音画同步、多镜头生成与声音驱动统一整合,使视频不再是简单片段拼接,而是具备节奏与情绪变化的完整内容。新增的分镜控制能力,可自动将简短提示转化为专业级多镜头结构,确保画面切换过程中叙事连贯、角色信息稳定,解决了多镜头生成中常见的内容断裂问题。

技术底座:多模态信息的统一表达
通义万相2.6在模型结构上采用多模态联合建模方案,对视频中的视觉时序信息与声音特征进行同步学习。通过对情绪、姿态、视角变化与音色、语速的联合建模,模型在生成阶段可实现跨模态一致性控制,使画面与声音在全流程中保持统一表达。这一设计,使模型具备从“生成画面”向“生成表演”的能力跃迁。

场景拓展:让视频创作进入普惠阶段
在应用层面,万相2.6兼顾大众创作与商业制作需求。普通用户通过简单操作即可生成具有叙事感的短视频内容;在广告与短剧制作场景中,模型可根据连续提示生成完整故事视频,并确保商品与角色信息在不同镜头中的一致呈现,为内容创作提供更高确定性。

生态推进:多入口释放模型价值
目前,万相2.6已在万相官网与阿里云百炼同步上线,企业用户可直接接入API能力。随着千问APP的后续支持,万相模型家族覆盖的视觉创作能力已超过十种,并持续在广告、短视频、AI漫剧等领域落地应用。业内普遍认为,万相2.6的发布将推动视频生成模型从“功能展示”阶段,迈向规模化应用阶段。

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...