首页 > 国际动态 > 正文
2024-09-19 22:37:34

国产视频生成模型加速迭代,一键创作影视级高清视频

9月19日,在杭州云栖大会上,通义万相宣布全面升级,并发布全新视频生成模型,这一事件标志着国产视频生成模型加速迭代进入新的阶段。

通义万相迭代后的大模型可一键生成影视级高清视频,并且已开放免费体验。其首批上线了文生视频、图生视频功能。在文生视频功能里,用户输入文字提示词(支持中英文多语言)就能生成高清视频,还可通过灵感扩写功能增强视频内容表现力,并且能按照16:9、9:16等多种比例生成视频。而图生视频功能则支持用户将任意图片转化为动态视频,可按照上传图像比例或预设比例生成,同时能利用提示词控制视频运动。

记者进行了体验,当输入“千里江山图古画,木舟在江上穿梭,江两岸高山连绵”的文案要求制作视频时,大概10分钟左右,大模型就完成了视频制作,生成的国漫3D风格视频中,船只在峡谷中穿梭,远方群山环绕,云遮雾绕。之后记者上传“飞碟从街道上空飞过”的图片要求生成为视频,大模型很快生成视频,还为飞碟配上赛博背景音,由近及远,十分真实。不过记者发现,大模型生成的视频最长5秒左右,每秒30帧,分辨率为720P,并且能生成与画面匹配的音效。

随着Sora的出现,国内众多厂商将AI生成视频作为追逐焦点。不久前,快手上线自研的视频生成大模型“可灵”,智谱AI推出AI生成视频模型智谱清言,百度、腾讯、字节也在积极布局。要成为“中国版Sora”,还需解决画面表现力和大幅度运动等视频生成技术难题。通义万相相关负责人表示,视频生成大模型技术的提升主要靠针对运动生成和物理模拟等难点优化算法,以实现大幅度主体运动和运镜控制,模拟真实世界物理特性。虽然与能生成60秒视频的Sora相比,国产视频生成大模型制作的视频时长还有提升空间,但在电商、广告、影视等领域现阶段的时长已基本满足使用。业内人士称,视频生成大模型免费开放使用能为创作者提供更多灵感,其生成的影视级高清视频已可应用于影视创作、动画设计、广告设计等领域。