LivePortrait 本地部署教程,强大且开源的可控人像AI视频生成

 
 

 

 

1,准备工作,本地下载代码并准备环境,运行命令前需安装git

没有外网环境的朋友可以直接点击【网盘打包下载

git clone https://github.com/KwaiVGI/LivePortrait
cd LivePortrait

# create env using conda
conda create -n LivePortrait python=3.9
conda activate LivePortrait

# install dependencies with pip
# for Linux and Windows users
pip install -r requirements.txt
# for macOS with Apple Silicon users
pip install -r requirements_macOS.txt

注意:确保您的系统已安装FFmpeg,包括ffmpegffprobe!不会安装?看这个FFmpeg 【安装教程

2. 下载预训练权重

下载预训练权重的最简单方法是从 HuggingFace 下载:

# first, ensure git-lfs is installed, see: https://docs.github.com/en/repositories/working-with-files/managing-large-files/installing-git-large-file-storage
git lfs install
# clone and move the weights
git clone https://huggingface.co/KwaiVGI/LivePortrait temp_pretrained_weights
mv temp_pretrained_weights/* pretrained_weights/
rm -rf temp_pretrained_weights

 

非海外用户,没有外网环境的朋友,你可以从Google Drive百度云网盘下载所有预训练权重。解压并将它们放在 中./pretrained_weights

确保目录结构如下,或包含:

pretrained_weights
├── insightface
│   └── models
│       └── buffalo_l
│           ├── 2d106det.onnx
│           └── det_10g.onnx
└── liveportrait
    ├── base_models
    │   ├── appearance_feature_extractor.pth
    │   ├── motion_extractor.pth
    │   ├── spade_generator.pth
    │   └── warping_module.pth
    ├── landmark.onnx
    └── retargeting_models
        └── stitching_retargeting_module.pth

3.推理使用

# For Linux and Windows
python inference.py

# For macOS with Apple Silicon, Intel not supported, this maybe 20x slower than RTX 4090
PYTORCH_ENABLE_MPS_FALLBACK=1 python inference.py

如果脚本成功运行,你会得到一个名为 的输出mp4文件animations/s6--d0_concat.mp4。此文件包含以下结果:驾驶视频,输入图像或视频,以及生成的结果。

图像

或者您可以通过指定-s和参数-d来更改输入

# source input is an image
python inference.py -s assets/examples/source/s9.jpg -d assets/examples/driving/d0.mp4

# source input is a video ✨
python inference.py -s assets/examples/source/s13.mp4 -d assets/examples/driving/d0.mp4

# more options to see
python inference.py -h

参照视频自动裁剪 📢📢📢

 

要使用您自己的参照视频,我们建议:⬇️

  • 将其裁剪为1:1 的宽高比(例如 512×512 或 256×256 像素),或通过 启用自动裁剪--flag_crop_driving_video
  • 重点关注头部区域,与示例视频类似。
  • 尽量减少肩部运动。
  • 确保参照视频的第一帧是正面且表情中性

以下是自动裁剪的案例--flag_crop_driving_video

python inference.py -s assets/examples/source/s9.jpg -d assets/examples/driving/d13.mp4 --flag_crop_driving_video

如果觉得自动裁剪的效果不好,您可以修改--scale_crop_driving_video--vy_ratio_crop_driving_video选项来调整比例和偏移量,或者手动进行调整。

动作模板制作

 

您还可以使用自动生成的以 结尾的运动模板文件来.pkl加速推理,并保护隐私,例如:

python inference.py -s assets/examples/source/s9.jpg -d assets/examples/driving/d5.pkl # portrait animation
python inference.py -s assets/examples/source/s13.mp4 -d assets/examples/driving/d5.pkl # portrait video editing

4. Gradio 可视化界面操作

在Gradio的可视化界面下可以获得更好的体验,适合新手使用,只需运行下面安装代码即可:

# For Linux and Windows users (and macOS with Intel??)
python app.py

# For macOS with Apple Silicon users, Intel not supported, this maybe 20x slower than RTX 4090
PYTORCH_ENABLE_MPS_FALLBACK=1 python app.py

您可以指定--server_port、、--share参数--server_name来满足您的需求!

🚀 它们还提供了加速选项--flag_do_torch_compile。首次推理会触发优化过程(约一分钟),使后续推理速度提高 20-30%。性能提升可能因 CUDA 版本的不同而有所差异。

# enable torch.compile for faster inference
python app.py --flag_do_torch_compile

注意:Windows 和 macOS 不支持此方法。或者,在HuggingFace上轻松尝试一下🤗

5. 推理速度评估

 

下方提供了一个脚本来评估每个模块的推理速度:

# For NVIDIA GPU
python speed.py

以下是使用原生 PyTorch 框架在 RTX 4090 GPU 上推断一帧的结果torch.compile

模型 参数(米) 模型大小(MB) 推理(毫秒)
外观特征提取器 0.84 3.3 0.82
运动提取器 28.12 108 0.84
铲形发电机 55.37 212 7.59
变形模块 45.53 174 5.21
拼接和重定向模块 0.23 2.3 0.31

注意:拼接和重定向模块的值代表三个连续 MLP 网络的组合参数数量和总推理时间。

当然如果你没有一张好的显卡,无法本地运行,那么可以在huggingface上免费体验:【点击前往】在线使用

详细的LivePortrait安装教程如下:

THE END
喜欢就支持一下吧
点赞2178 分享
最新爆料:DeepSeek R2 即将发布!成本比GPT-4o暴跌 97%-零度博客

最新爆料:DeepSeek R2 即将发布!成本比GPT-4o暴跌 97%

近日,AI领域迎来一则爆炸性消息——国内顶尖AI研究机构深度求索(DeepSeek)即将推出新一代混合专家模型(MoE)DeepSeek R2。该模型不仅在规模上达到世界顶级水平,更在推理效率、成本控制及国...
admin的头像-零度博客admin
1.1W+2528
Chia奇亚币“挖矿”就是个骗局!硬盘挖矿就为中国新韭菜量身定制的局 | 零度解说-零度博客
PDF加盖骑缝章的工具,免费开源【PDFQFZ】-零度博客

PDF加盖骑缝章的工具,免费开源【PDFQFZ】

PDF加盖骑缝章的小工具 选择需要盖章的PDF文件或文件夹。 选择保存文件夹。 导入完整的印章图片,工具会根据PDF页数做随机分割。 设定印章大小,骑缝章位置,印章位置等 点盖章,骚等后在保存文件...
admin的头像-零度博客admin
2.1W+2177
谷歌正在关闭 Stadia!将退还所有 Stadia 购买 - 硬件、软件和 DLC-零度博客

谷歌正在关闭 Stadia!将退还所有 Stadia 购买 – 硬件、软件和 DLC

谷歌正在关闭 Stadia 谷歌将退还所有 Stadia 购买 - 硬件、软件和 DLC。Stadia 团队的成员将在 Google 的其他部门“推进这项工作”。 谷歌正在关闭其云游戏服务 Stadia。该服务将持续为玩家提供...
admin的头像-零度博客admin
1.6W+2250
“阎罗王”敲诈勒索病毒解密工具+使用教程!-零度博客

“阎罗王”敲诈勒索病毒解密工具+使用教程!

  阎罗王敲诈勒索病毒解密工具,由卡巴斯基提供:【点击下载】   具体的使用教程如下:【官方教程】 RannohDecryptor 工具旨在解密由以下勒索软件加密的文件: 木马-Ransom.Win32.Ran...
admin的头像-零度博客admin
1.7W+2250
让老照片动起来!通过 AI 一键搞定,按要求生成动态视频-零度博客

让老照片动起来!通过 AI 一键搞定,按要求生成动态视频

岁月如沙,从指缝悄然流逝。那些定格在泛黄照片里的笑脸,曾是我们最珍贵的瞬间。如今,科技让逝去的时光重现生机,让我们一同重温那些逐渐模糊的记忆,感受时光荏苒中永恒不变的温暖。 如今,科技的...
admin的头像-零度博客admin
3.9W+2181
新电脑到手后要做的7件重要事情,一件也不能漏!| 零度解说-零度博客

新电脑到手后要做的7件重要事情,一件也不能漏!| 零度解说

新电脑到手后你一定要记得做的7件重要事情... https://youtu.be/gXR93R1GNzk
admin的头像-零度博客admin
1.6W+2250
视频会议,电脑清理,BT种子下载,视频编辑,浏览器推荐!-零度博客

视频会议,电脑清理,BT种子下载,视频编辑,浏览器推荐!

  可以替换为下面的软件 Google meet : https://meet.google.com Discord : https://discord.com Microsoft Teams: https://www.microsoft.com/en-us/microsoft-365/microsoft-teams/group...
admin的头像-零度博客admin
1.6W+2251
Youtube视频小技巧 | 看油管视频的这些方法你都知道吗?-零度博客

Youtube视频小技巧 | 看油管视频的这些方法你都知道吗?

https://youtu.be/KO-yFbjtXGg YouTube视频里面这几个小技巧,非常实用的,非常的方便。如果能够熟练运用这些小技巧,将会给我们在观看视频的时候,带来更好的观看体验。快速预览功能,视频自动...