科技快讯：阿里发布万相2.6系列模型，国内首个角色扮演功能上线，支持音画同步

4.2K 00

行业节点：视频生成从“单点能力”走向体系化
随着AI视频技术加速演进，行业竞争已从单一画面质量比拼，转向完整创作流程的能力整合。12月16日，阿里发布通义万相2.6系列模型，明确瞄准专业影视制作与高质量内容创作场景，标志着国内视频生成模型开始系统性解决“连续叙事”问题。

能力亮点：国内首个角色扮演视频模型
万相2.6的核心突破，在于其率先实现角色扮演能力的工程化落地。模型可参考输入视频中的人物形象与声音特征，在新生成的视频中保持角色外观、音色与行为的一致性。这一能力不仅适用于单人演绎，也支持多人互动及人与物体同框的复杂场景，为长链路视频生成奠定基础。

创作升级：多镜头与音画同步协同实现
在创作体验上，万相2.6将音画同步、多镜头生成与声音驱动统一整合，使视频不再是简单片段拼接，而是具备节奏与情绪变化的完整内容。新增的分镜控制能力，可自动将简短提示转化为专业级多镜头结构，确保画面切换过程中叙事连贯、角色信息稳定，解决了多镜头生成中常见的内容断裂问题。

技术底座：多模态信息的统一表达
通义万相2.6在模型结构上采用多模态联合建模方案，对视频中的视觉时序信息与声音特征进行同步学习。通过对情绪、姿态、视角变化与音色、语速的联合建模，模型在生成阶段可实现跨模态一致性控制，使画面与声音在全流程中保持统一表达。这一设计，使模型具备从“生成画面”向“生成表演”的能力跃迁。

场景拓展：让视频创作进入普惠阶段
在应用层面，万相2.6兼顾大众创作与商业制作需求。普通用户通过简单操作即可生成具有叙事感的短视频内容；在广告与短剧制作场景中，模型可根据连续提示生成完整故事视频，并确保商品与角色信息在不同镜头中的一致呈现，为内容创作提供更高确定性。

生态推进：多入口释放模型价值
目前，万相2.6已在万相官网与阿里云百炼同步上线，企业用户可直接接入API能力。随着千问APP的后续支持，万相模型家族覆盖的视觉创作能力已超过十种，并持续在广告、短视频、AI漫剧等领域落地应用。业内普遍认为，万相2.6的发布将推动视频生成模型从“功能展示”阶段，迈向规模化应用阶段。

本内容由 AI 生成，仅供参考，不构成新闻报道。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

科技快讯：阿里发布万相2.6系列模型，国内首个角色扮演功能上线，支持音画同步

科技动态：蚂蚁集团AI健康助手AQ启用中文名“蚂蚁阿福”，推出“健康小目标”功能

悲剧！美国男子听信ChatGPT杀害母亲后自杀，家属起诉，OpenAI拒交聊天记录

相关文章

暂无评论

推荐文章

网址

FreeOK

韩漫网

通义万相

owllook

糖豆影视

小红影视

科技快讯：阿里发布万相2.6系列模型，国内首个角色扮演功能上线，支持音画同步

科技动态：蚂蚁集团AI健康助手AQ启用中文名“蚂蚁阿福”，推出“健康小目标”功能

悲剧！美国男子听信ChatGPT杀害母亲后自杀，家属起诉，OpenAI拒交聊天记录

相关文章

暂无评论

推荐文章

网址

FreeOK

韩漫网

通义万相

owllook

糖豆影视

小红影视

标签云