OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
相关推荐
Anvi Folder Locker 文件夹加密软件! 免费好用,值得推荐-零度博客

Anvi Folder Locker 文件夹加密软件! 免费好用,值得推荐

1.Anvi Folder Locker:【点击下载】,【备用下载】 2.EFS 微软自带的文件夹加密 ⬇ 使用教程:https://www.freedidi.com/2750.html
网页长截图插件,免费支持Chrome、edge等主流浏览器!-零度博客

网页长截图插件,免费支持Chrome、edge等主流浏览器!

这款插件可以完整可靠地捕获当前页面的屏幕截图 - 无需请求任何额外的权限! 获取当前浏览器窗口的整页屏幕截图的最简单方法。单击扩展程序图标(或按 Alt+Shift+P),观看扩展程序捕获页面的每...
admin的头像-零度博客admin
1.4W+1527
美女图被插后门!!我们该如何确保自己下载的资源是安全、靠谱的? | 零度解说-零度博客
开源工具 ViveTool + 开启 Win11 新版任务管理器的UI设计!-零度博客

开源工具 ViveTool + 开启 Win11 新版任务管理器的UI设计!

ViveTool 工具:【点击下载】   开启 Win11  新版任务管理器的UI命令: vivetool addconfig 35908098 2 vivetool addconfig 37204171 2 vivetool addconfig 36898195 2 vivetool addconfi...
admin的头像-零度博客admin
1.6W+2251
永久免费白嫖甲骨文VPS,需要服务器的快上车!| 零度解说-零度博客
StableStudio: 人手一个 Midjourney,Stability AI 开源的 AI 图像生成平台-零度博客

StableStudio: 人手一个 Midjourney,Stability AI 开源的 AI 图像生成平台

 安装步骤:首先您需要安装Node.js和Yarn。然后运行以下命令安装依赖项并启动 StableStudio。安装好Node.js以后,输入下方命令进行安装Yarnnpm install --global yarn验证安装 安装完成后,运...
admin的头像-零度博客admin
2.4W+3253
Windows 10 /11 优化天花板!开启最强模式,让电脑更丝滑、更流畅!这样玩才更爽 | 零度解说-零度博客

Windows 10 /11 优化天花板!开启最强模式,让电脑更丝滑、更流畅!这样玩才更爽 | 零度解说

https://youtu.be/HSn9E31L4gc1、开启卓越性能代码:https://www.freedidi.com/1241.html 2、上帝模式代码:https://www.freedidi.com/5872.html 3、Wintoys 优化神器下载:https://www.freedid...
7款超好用的 Edge插件!让你的浏览器瞬间开挂!-零度博客

7款超好用的 Edge插件!让你的浏览器瞬间开挂!

  1.Global Speed: 视频速度控制【链接】 2.Fatkun图片批量下载【链接】 3.SuperCopy 超级复制 [链接] 4.油猴插件 、GreasyFork【链接】 5.Screen Recorder 录屏 【链接】 6.PrintFriendly...
admin的头像-零度博客admin
1.7W+2251
Watt Toolkit 一款能白嫖加速的软件!免费开源-零度博客

Watt Toolkit 一款能白嫖加速的软件!免费开源

Watt Toolkit 是一款能白嫖加速的软件,之前是叫做Steam++,电脑自带的微软商城就能下载。 在黑神话·悟空火爆全网,但是有些小伙伴下载了Steam发现,网络无法连接,而雷电、UU、迅游等加速器又...
admin的头像-零度博客admin
2.5W+3252