OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错

OmniHuman 支持多种视觉和音频风格,可生成任意长宽比和身体比例(人像、半身、全身合一)的逼真人体视频,真实感源自动作、光照、纹理细节等综合方面。

c05a8b350120250306195529

官方项目链接:https://omnihuman-lab.github.io

图片[2]-OmniHuman-1 多模态 “真人”视频生成项目! 效果真不错-零度博客

歌唱

OmniHuman 可以支持各种音乐风格,并适应多种身体姿势和歌唱形式。它可以处理高音调的歌曲,并针对不同类型的音乐显示不同的动作风格。请记住选择最高的视频质量。生成的视频质量也高度依赖于参考图像的质量。

与视频驾驶的兼容性

由于OmniHuman的混合条件训练特性,它不仅可以支持音频驾驶,还可以支持视频驾驶来模仿特定的视频动作,以及像最近的方法一样结合音频和视频驾驶来控制特定的身体部位。

道德问题

这些演示中使用的图像和音频来自公开来源或由模型生成,仅用于展示本研究工作的能力。如有任何问题,请联系我们(jianwen.alan@gmail.com),我们将及时删除。本网页模板基于VASA-1的模板,部分测试音频来自VASA-1LoopyCyber​​Host

BibTeX

如果您发现这个项目对您的研究有用,您可以引用我们并查看我们的其他相关作品:


          @article{lin2025omnihuman1,
            title={OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models}, 
            author={Gaojie Lin and Jianwen Jiang and Jiaqi Yang and Zerong Zheng and Chao Liang},
            journal={arXiv preprint arXiv:2502.01061},
            year={2025}
          }
          
          @article{jiang2024loopy,
            title={Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency},
            author={Jiang, Jianwen and Liang, Chao and Yang, Jiaqi and Lin, Gaojie and Zhong, Tianyun and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.02634},
            year={2024}
          }

          @article{lin2024cyberhost,
            title={CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention},
            author={Lin, Gaojie and Jiang, Jianwen and Liang, Chao and Zhong, Tianyun and Yang, Jiaqi and Zheng, Yanbo},
            journal={arXiv preprint arXiv:2409.01876},
            year={2024}
          }
        
THE END
喜欢就支持一下吧
点赞2672 分享
如何更改哪些 Facebook 好友可以在线看到您-零度博客

如何更改哪些 Facebook 好友可以在线看到您

可以在 Facebook 上维护隐私。以下是如何确定哪些 Facebook 朋友可以在线看到您,哪些不能。 Facebook 对自己的目标持开放态度:公司梦想一个每个人都可以随时联系的世界。也许这就是为什么在 F...
admin的头像-零度博客admin
1.6W+2251
AI 贴近真实人物的生成! 提示词+生成参数和模型下载!-零度博客

AI 贴近真实人物的生成! 提示词+生成参数和模型下载!

  1.模型下载:【点击获取】,注意:如果无法下载,可以使用VPN【点击获取】进行代理下载。 2.没有 Stable Diffusion?【点击前往】下载安装 3.高清化算法 4x-UltraSharp:【点击下载】 提...
admin的头像-零度博客admin
1.4W+1528
推荐7个非常实用的电脑工具! 提高学习、工作的效率神器!-零度博客
微软发布首款 Majorana 1 量子芯片!人类计算即将被彻底颠覆?| 零度解说-零度博客
历时1年!英特尔终于找到13/14代CPU 不稳定原因, 受影响用户可联系更换-零度博客

历时1年!英特尔终于找到13/14代CPU 不稳定原因, 受影响用户可联系更换

经过近一年的调查,英特尔终于找到了第 13/14 代桌面处理器在某些情况下出现不稳定甚至崩溃的原因。这些问题通常在用户玩游戏或运行高负载任务时出现,严重影响了用户的使用体验。 最初,英特尔...
真上天了!马斯克投资的飞行汽车试飞成功,Alef Model A/Z 售价低至 3.5 万美元 | 零度解说-零度博客
Astra Linux 一款基于Linux的俄罗斯计算机操作系统(OS)-零度博客

Astra Linux 一款基于Linux的俄罗斯计算机操作系统(OS)

Astra Linux 是一款基于Linux的俄罗斯计算机操作系统(OS),正在俄罗斯联邦广泛部署,以取代 Microsoft Windows。因为微软曾经在俄罗斯被禁止出售,当然现已解封。Astra Linux 是公认的 Debian ...
admin的头像-零度博客admin
1.8W+2499
TunnelBear:免费服务器覆盖 48 个国家,每月有 2000MB 数据-零度博客

TunnelBear:免费服务器覆盖 48 个国家,每月有 2000MB 数据

这款免费VPN在全球服务器网络覆盖 48 个国家 具有高级加密标准、泄露保护、终止开关和无日志政策 支持无限台设备同时连接 用户友好的应用程序兼容 Windows、Mac、Android、iOS、Linux、路由器等...
admin的头像-零度博客admin
1.5W+1528
【直播】100万订阅奖牌开箱!🎉 抽奖送会员,在线答疑 AI / 软件 / 安全等!真的要女装??| 零度解说-零度博客