科技日报记者 罗云鹏
9月25日,生数科技发布新一代图生视频年夜模子Vidu Q2。该模子于极致心情变化、推拉运镜、天生速率和语义理解方面取患上进展,实现从“天生视频”到“天生演技”,从“动态流利”到“感情表达”的超过,让AI视频天生技能从寻求“形似”进入“神似”新阶段。
当前,AI视频天生已经能实现基本的动作联贯,但天生的脚色往往心情僵直、眼神浮泛,缺少细节及感动人心的感情表达,AI天生视频中的脚色也常被诟病为“面瘫”或者心情僵化,这成为AI行业范围化成长瓶颈。
Vidu Q2可以或许理解并天生细腻的脸部微心情。例如嘴角不经意地抽动、眼神中一闪而过的夷由、眉头微蹙表达的疑虑等。
生数科技首席履行官骆怡航暗示:“Vidu Q2的冲破于在咱们初次让AI脚色拥有了‘有趣的魂灵’。咱们让AI学会了‘演戏’,这不仅是技能的里程碑,更是通向更高级他人工智能不成或者缺的一步。”
据悉,Vidu Q2经由过程深度理解感情文本、图文解析,并联合对于人面子部动作单位的邃密解构与物理模仿,从而于视频中驱动脚色脸部肌肉、肢体肌肉孕育发生切合感情逻辑的细微运动。除了了微心情,Vidu Q2于天生可控和一致性等方面也有了多方位晋升。
此外,首尾帧、双出片模式和2—8秒筛选等统筹出片质量与效率的产物设计模式,网页版、App版和API同步上线的多渠道化,使患上Vidu Q2可以或许矫捷适配从高端影视建造到快速社交媒体内容出产的差别需求。
(受访者供图)
-亿电竞分享