OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
相关推荐
让Windows 11 看起来像 macOS-零度博客

让Windows 11 看起来像 macOS

1.SecureUxTheme:【点击下载】 2.LIT3-for-Windows:【点击下载】 或【网盘下载】 3.BIB3-for-Windows:【点击下载】 或【网盘下载】 4.Make Windows 11 Look Like macOS:【点击下载】 5.star...
admin的头像-零度博客admin
2.1W+3254
免费杀毒软件推荐!彻底查杀病毒木马,不花一分钱也能保护电脑!2025 最新实测 | 零度解说-零度博客
超真实 Stable Diffusion AI 大模型!完全免费,生成图片光效氛围感爆棚!!| 零度解说-零度博客

超真实 Stable Diffusion AI 大模型!完全免费,生成图片光效氛围感爆棚!!| 零度解说

这是基于 Stable Diffusion的真人大模型,生成的图片不仅非常好看,更有质感! 而且它还进一步解决了以往AI图片一脸假或者是网红脸的问题 现在我们就来演示一下........   https://youtu.b...
admin的头像-零度博客admin
2.2W+2176
老司机必备的电脑实用技巧!这17个你都知道哪些? | 零度解说-零度博客
无需魔法访问 Google !堪称Web式的云端电脑?-零度博客

无需魔法访问 Google !堪称Web式的云端电脑?

无需“魔法”就能访问 Google ?关键时期开源当作备用,查资料方便, 堪称Web式的云端电脑! Dustinbrett平台:【链接直达】 
admin的头像-零度博客admin
2.8W+1555
盘点全网最搞笑的名场面!简直笑到腿抽筋,看你能坚持到几个 | 零度解说-零度博客
对印第一安纳波利斯房局的勒索软件攻击泄露了 200,000 名居民的敏感信息-零度博客

对印第一安纳波利斯房局的勒索软件攻击泄露了 200,000 名居民的敏感信息

印第安纳波利斯住房局通知超过 200,000 人,他们的信息(包括社会安全号码等)在 9 月份开始的勒索软件攻击中泄露。 由联邦的机构负责为印第安纳波利斯印第安纳波利斯低收入租户住房。。。。。...
admin的头像-零度博客admin
1.3W+6540
Web3.0 网络是否真的能实现?它会带来什么后果! 答案就在这里 (2022)| 零度解说-零度博客
Windows 11不够好用? 教你几招让Win11变得更顺手!-零度博客

Windows 11不够好用? 教你几招让Win11变得更顺手!

Windows 11在很多地方都做了调整,但由于涉及到诸多旧有习惯,再加上前期Bug的缘故,初上手时让人很不适应。 好在微软的号召力不俗,各种“改装”小工具也是层出不穷。虽然不能解决掉Win11的所...
admin的头像-零度博客admin
1.8W+2250