OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
相关推荐
100% 免费的安全VPN,速度超快!秒开 4K、8K视频,这五款值得推荐!!【 2024 】| 零度解说-零度博客
Windows 10 的这个技巧,你一定要知道! 有福利 2021 | 零度解说-零度博客
找回150枚比特币!价值1000万美金,如果你能花出去,免费奉送!| 零度解说-零度博客

找回150枚比特币!价值1000万美金,如果你能花出去,免费奉送!| 零度解说

https://www.youtube.com/watch?v=Krmh8Iy3Uy4 ================ 150枚比特币文件下载:https://www.freedidi.com/12578.html
admin的头像-零度博客admin
2.2W+2177
新一代 Windows :微软 Win11 操作系统发布会直播-零度博客

新一代 Windows :微软 Win11 操作系统发布会直播

    Windows 11 最新安装教程,永久免费激活!( 附ISO镜像下载 )      
100% 由 AI 拍摄的《红楼梦》视频,1分钟让你看完四大名著之一 | 零度解说-零度博客

100% 由 AI 拍摄的《红楼梦》视频,1分钟让你看完四大名著之一 | 零度解说

https://www.youtube.com/watch?v=NDh24E6_86g   AI 版《红楼梦》视频提示词获取:https://www.freedidi.com/14729.html
admin的头像-零度博客admin
2.1W+3252
爆高危漏洞! Chrome、Edge 浏览器紧急发布:已证明被黑客利用的零日漏洞修复 | 零度解说-零度博客
如果您仍然想念 Google Reader,一个新的基于 Web 的 RSS 客户端 【Substack 】更适合你-零度博客

如果您仍然想念 Google Reader,一个新的基于 Web 的 RSS 客户端 【Substack 】更适合你

Substack 的 RSS 提要阅读器现在可以作为 Web 和移动应用程序使用,这可以使其更广泛地使用。 Substack 是最新一家试图让谷歌阅读器死而复生的公司——至少在精神上是这样。 在 Google 流行的 R...
admin的头像-零度博客admin
1.7W+2250
Windows 10  盗版用户注意!系统镜像被黑客植入偷钱病毒,攻击手法非常罕见 ,这是自救的最佳方法!| 零度解说-零度博客
32 年后,微软决定重新命名“Microsoft Office”-零度博客

32 年后,微软决定重新命名“Microsoft Office”

微软 Office 于 1990 年首次发布,除了 Windows,它可能是普通大众最有经验的微软产品。Word、Excel、PowerPoint 和 Outlook 等单个应用程序都将继续存在,但从现在开始,这些应用程序都归入的 ...
admin的头像-零度博客admin
1.7W+2251