AI技术大突破,个性化舞蹈视频生成惊艳网络
从兵马俑、埃隆·马斯克到普通网友,大家都在社交媒体和朋友圈疯狂分享一种新的舞蹈视频——这并非仅仅是一股潮流,而是技术创新的最新展示。2024年伊始,国内社交平台上充斥着这些约10秒长的舞蹈视频,人们对这种使用单张照片即可生成动态视频的大模型应用赞叹不已。这项技术使得即使是那些自诩舞蹈动作生涩的网友也可以轻易成就一段流畅的舞蹈视频。
在阿里云通义千问APP的新功能上线之后,用户体验风暴汹涌而来。人们只需通过简单的口令如 “通义舞王” 或 “全民舞王” 即可体验这一创新,上传一张照片,经过短短十几分钟的等待就能获得一个高度还原面部表情、身材比例、服装和背景的动态舞蹈视频。网友们为此欢呼,表示AI已经帮他们克服了舞蹈上的笨拙,科目三舞也不再是跌跟头的风险。
甚至考古领域的专业人士也加入到这场刷屏潮流中,视频内容丰富多样,用户可以基于科目三、蒙古舞、划桨步、鬼步舞等12种热门舞蹈模板中选择自己心仪的舞蹈风格。这背后的神秘力量是阿里通义实验室自研的视频生成模型—Animate Anyone。该模型自11月末在海外社交媒体上爆火起,在Github上的关注度连日飙升,显示出国际开发者和用户群体对此技术的高度认可和热切期待。
相比其他技术路线,Animate Anyone的创新之处在于其卓越的视频生成能力。它利用了ReferenceNet以精确捕捉并保留原图像信息,可以极高程度的复现人物、表情和服装细节。结合Pose Guider的姿态引导功能和时序生成模块的应用,它在保证动作真实可控的同时,也实现了视频帧间的顺滑过渡。在相同数据集的测试中,Animate Anyone的性能表现优于其他同类模型。
9月份,通义千问成为国内首批通过备案的大模型,随APP上线后功能的不断升级,它已经提供了文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等多项功能。在探讨未来科技与人类生活融合的途径时,这种创意无限的AI技术无疑将成为人们关注的热点之一。