阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能

2025-12-16 发布 · 浏览21次 · 点赞0次 · 收藏0次
感谢网友 啊俊Djoker_Huang 的线索投递!

12 月 16 日消息,阿里发布新一代万相 2.6 系列模型,该系列模型面向专业影视制作和图像创作场景进行了全面升级,全新的万相 2.6 是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能,是全球功能最全的视频生成模型。万相 2.6 已同步上线阿里云百炼、万相官网。

图片

附官方介绍如下:

万相 2.6 视频生成升级亮点

角色扮演

万物皆可入戏,万相 2.6 能参考输入视频中的角色外观和音色、实现角色扮演,按照提示词生成单人、多人、人与物合拍的视频。

多镜头叙事

万相 2.6 可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性。

自然音画同步

多人对话场景稳定生成,真实自然的人声表达,声音质感提升,更好听的音乐和歌曲生成。

15s 长视频生成

生成视频最长 15s(参考生视频 10s),提升画面时空内容容量,支持更完整叙事。

音频驱动生成

万相 2.6 可根据用户输入的文本和音频,驱动生成视频,并实现多镜头演绎。

万相 2.6 文生图升级亮点

艺术风格的高度美学与可控性

  • 精准捕捉艺术灵魂:对各类风格关键词理解深入,还原度更高,画面整体风格统一且完整。

  • 风格融合自然流畅:支持多种艺术风格有机融合,过渡平滑,创作出独具一格的视觉作品。

  • 细节刻画生动丰富:对「肌理、色彩、笔触」等细节的呈现更为到位,赋予图像故事感与表现力。

真实人像质感,光影细节到位

在写实人像生成中,人物神态自然、肤质真实,有效削弱“AI 感”。模型综合优化构图与光影,呈现更具表现力的人像视角。

文字生成,图表、插画与海报设计

可依据中英文长文本内容,结合美学设计与图文协调性,精准生成海报、图文说明、信息图表等,实现内容与视觉的高度统一。

万相 2.6 图像生成升级亮点

图文混排输出

多张图片和文字一体化生成,具备逻辑推理能力,实现有层次、有逻辑的视觉化叙事。

多图融合生成

多张图片的任意参考、组合或替换,融合多重视觉灵感,生成全新创意图像。

商用级一致性保持

保持角色、风格或元素的高度一致,拓展商业级使用场景。

美学要素迁移

提取参考图的颜色、风格、构图等创意灵感,实现美学参考生成。

镜头和光影精准控制

可指定镜头视角、近远景及光影细节,实现对画面空间与氛围的精确调控。

阿里发布万相 2.6 系列模型,上线国内首个角色扮演功能 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。