最新超长AI视频模型!一句话即可生成120秒视频,免费开源!

图片[1]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

  1. 生成时长达2分钟(1200帧),超越以往模型
  2. 视频质量优秀
  3. 与业内其他主流模型实现无缝衔接
  4. 开源免费,便于开发者使用和二次开发

图片[2]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

 

免费在线试玩:【点击进入】 目测在线人太多需要排队

自己本地搭建教程:

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载:网盘下载

3.安装必备的环境:

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

 

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

 

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

 

ModelscopeT2V作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 40秒 165秒
56帧 75秒 360秒
80帧 110秒 525秒
240帧 340秒 1610 秒(约 27 分钟)
600帧 860秒 5128 秒(约 85 分钟)
1200帧 1710 秒(约 28 分钟) 10225 秒(约 170 分钟)
AnimateDiff作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 50秒 180秒
56帧 85秒 370秒
80帧 120秒 535秒
240帧 350秒 1620 秒(约 27 分钟)
600帧 870秒 5138 秒(~85 分钟)
1200帧 1720 秒(约 28 分钟) 10235 秒(约 170 分钟)
SVD作为基本模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 80秒 210秒
56帧 115秒 400秒
80帧 150秒 565秒
240帧 380秒 1650 秒(约 27 分钟)
600帧 900秒 5168 秒(~86 分钟)
1200帧 1750 秒(约 29 分钟) 10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时,采用随机混合。对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用:【点击前往】 支持多模型自由切换!

THE END
喜欢就支持一下吧
点赞2177 分享
在手机上更改 Wi-Fi密碼 | 零度解说-零度博客

在手机上更改 Wi-Fi密碼 | 零度解说

https://youtu.be/OKWPH8BvxIw
admin的头像-零度博客admin
1.7W+2250
谷歌翻译为何退出中国?被迫的还是主动的?该如何恢复 Chrome 翻译功能? | 零度解说-零度博客

谷歌翻译为何退出中国?被迫的还是主动的?该如何恢复 Chrome 翻译功能? | 零度解说

谷歌翻译退出中国后该如何恢复 Chrome 翻译的正常使用?   https://youtu.be/bmF6U4ynZVU   下面是获取可用 IP 地址以及修改 Windows 系统和 macOS 系统 hosts 文件的自动化脚本代码...
切勿错过这个几乎接近完美的免费开源系统!Linux Mint-零度博客

切勿错过这个几乎接近完美的免费开源系统!Linux Mint

Linux Mint官网:https://linuxmint.com 用的到写盘工具Rufus:https://rufus.ie 安装教程:https://youtu.be/uwidj-d9Jgw
最实用的AI视频去码!简单好用效果又非常棒,附上CodeFormer-GUI 使用教程,小白都能轻松驾驭 | 零度解说-零度博客
零度推荐的7个非常实用的网站!-零度博客

零度推荐的7个非常实用的网站!

edit.photo 图片在线编辑器:【点击进入】 Userbenchmark: 【点击进入】 显卡超频参数网站:【点击进入】 AfterBurner 显卡超频软件: 【点击下载】 ExpressVP 优惠链接: 【点击获取】 最好的...
admin的头像-零度博客admin
1.6W+2251
新电脑到手后要做的7件重要事情,一件也不能漏!| 零度解说-零度博客

新电脑到手后要做的7件重要事情,一件也不能漏!| 零度解说

新电脑到手后你一定要记得做的7件重要事情... https://youtu.be/gXR93R1GNzk
admin的头像-零度博客admin
1.7W+2250
M2 Pro Mac mini 评测:优缺点!适合半专业人士的 Apple Goldilocks 台式机-零度博客

M2 Pro Mac mini 评测:优缺点!适合半专业人士的 Apple Goldilocks 台式机

Apple 的 Mac Studio是多年来最有趣的桌面。它缺乏 Mac Pro 的内部可扩展性,但 M1 Max 和 M1 Ultra 的原始性能和电源效率以及出色的端口选择使其成为许多购买满载 27 英寸 iMac 或英特尔时代的...
admin的头像-零度博客admin
1.4W+6539
Github上非常火的8个免费开源项目!-零度博客

Github上非常火的8个免费开源项目!

1.图片去除马赛克:  【官方下载】、【备用下载】2.TecoGAN 视频去马赛克:  【官方下载】、【备用下载】3.TrafficMonitor 电脑硬件温度监控:【官方下载】、【备用下载】4.上班摸鱼神器: 【链...
admin的头像-零度博客admin
3.1W+6249
Windows 11 最新版 (24H2)发布了!新增AI视频超分辨率、声音克隆、Sudo提权等实用功能!附详细的免费升级教程 | 零度解说-零度博客