首页 > 国际动态 > 正文
2024-09-19 15:56:24

阿里通义万相视觉生成大模型升级,开启多模态创作新时代

2024年9月19日,在云栖大会上,阿里云发布了通义万相Wanx视觉生成大模型的重大升级,这一升级为视觉创作领域带来了全新的可能性。

通义万相此前以文生图能力被大众所熟知,如今在此基础上,全面进化,新增了文生视频、图生视频等功能。这意味着用户在创作过程中,无论是一段富有想象力的文字描述,还是一张已有的图片,都能够轻松转化为视频内容。例如,在文生视频功能中,用户输入任意文字提示词,像“阳光洒在古老城堡上的宁静画面”,即可生成一段高清视频,并且支持中英文多语言输入,还能通过灵感扩写功能智能丰富视频内容表现力,同时支持16:9、9:16等多种比例生成。而图生视频功能则允许用户将任意图片转化为动态视频,按照上传的图像比例或预设比例进行生成,还可以通过提示词来控制视频运动。

除了文生视频和图生视频功能外,通义万相还具备插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化能力。这使得它在影视创作、动画设计、广告设计等众多领域都有着广泛的应用前景。

据阿里云官方透露,通义万相累计创作图片数已达7500万+,累计用户数已达93万+。其官网显示,全新发布的自研AI视频生成大模型,具备“强大的画面视觉动态生成能力”,擅长概念理解与组合生成,优化中式元素表现,同时支持多语言与可变分辨率生成。

即日起,所有用户可通过通义APP及通义万相官网免费体验这一升级后的大模型。随着通义万相视频生成模型的发布,通义大模型已覆盖文本生成、图像理解、视频理解、音频理解、图像生成、视频生成等全模态场景,这无疑将推动整个视觉创作领域向着更加智能化、多元化的方向发展。