OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
相关推荐
磁盘占用100%?这是最彻底的解决方法,瞬间提速10倍! | 零度解说-零度博客

磁盘占用100%?这是最彻底的解决方法,瞬间提速10倍! | 零度解说

https://youtu.be/wKH-7Du6YhQ =============== 本期视频所需的工具下载:https://www.freedidi.com/10449.html
admin的头像-零度博客admin
1.7W+1682
Team Red Miner + Gminer挖矿程序下载-零度博客

Team Red Miner + Gminer挖矿程序下载

1.Team Red Miner:【点击下载】 2.挖矿矿池获取:【点击进入】 3.Gminer:【点击下载】 4.实时算力和收益查询网站:【点击进入】  5.推荐的钱包:BRD 【点击获取】
admin的头像-零度博客admin
1.6W+2251
从此告别数据线,一键配对,内网、外网无限传输!PairDrop-零度博客

从此告别数据线,一键配对,内网、外网无限传输!PairDrop

PairDrop是一款创新的本地文件共享工具,它以浏览器为平台,实现了类似于苹果AirDrop的便捷文件传输功能。它不仅能够跨操作系统工作,还支持通过互联网进行文件传输,极大地提升了用户在不同设...
admin的头像-零度博客admin
2.3W+2176
AI 黑科技!老照片修复、视频去码秒变高清!2秒搞定,完全免费开源!! | 零度解说-零度博客

AI 黑科技!老照片修复、视频去码秒变高清!2秒搞定,完全免费开源!! | 零度解说

https://www.youtube.com/watch?v=2z7jeq6Z83o ============== 1.黑白老照片修复平台(免费):https://www.freedidi.com/11907.html 2.CodeFormer AI 视频、图片修复软件安装命令:https://www...
admin的头像-零度博客admin
1.5W+1528
英伟达被黑客脱库!190GB机密数据被公开,三星也被Lapsus$入侵-零度博客

英伟达被黑客脱库!190GB机密数据被公开,三星也被Lapsus$入侵

英伟达核心源码刚“被开源”,7万多员工信息又遭泄露。与此同时,黑客又“帮”三星把代码给开源了,顺便还把高通也捎上了。看起来,南美黑客团伙Lapsus$要和英伟达玩一把大的了。源代码才刚刚“...
admin的头像-零度博客admin
1.5W+2251
Vercel免费容器一键 部署 Hexo 轻量级的博客!-零度博客

Vercel免费容器一键 部署 Hexo 轻量级的博客!

安装教程 账号准备 请注册好:Github 账号  再前往Vercel 网站 使用Github账号注册一个账号。这样注册好以后 Vercel里面就可以看到你 Github 里面的项目了。 创建 Hexo 项目 创建 Hexo 项目直...
admin的头像-零度博客admin
1.3W+6541
视频会议,电脑清理,BT种子下载,视频编辑,浏览器推荐!-零度博客

视频会议,电脑清理,BT种子下载,视频编辑,浏览器推荐!

  可以替换为下面的软件 Google meet : https://meet.google.com Discord : https://discord.com Microsoft Teams: https://www.microsoft.com/en-us/microsoft-365/microsoft-teams/group...
admin的头像-零度博客admin
1.6W+2251
最好的免费VPN | 全球排名前五 | 这5款免费VPN亲测速度安全性都非常的棒!-零度博客

最好的免费VPN | 全球排名前五 | 这5款免费VPN亲测速度安全性都非常的棒!

https://youtu.be/vAA_iK4EzKE   本期视频主要更大家推荐全球排名前五的免费VPN,安全性,稳定性,可操作都非常的强,这些VPN提供了军事级别的加密,安全性有保障! 第一名:ProtonVPN 注...
鲜为人知,但很有意思的网站!-零度博客

鲜为人知,但很有意思的网站!

1.检测你长得帅不帅、漂不漂亮 【地址】 2.在线浏览世界各地景区的实况视频 【地址】 3.回忆童年记忆,在线玩小时候的游戏 【地址】 4.高端的天文网站 【地址 】 5.让人释放压力的鼠标跟随 【地...
admin的头像-零度博客admin
1.7W+2250