最新超长AI视频模型!一句话即可生成120秒视频,免费开源!

图片[1]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

  1. 生成时长达2分钟(1200帧),超越以往模型
  2. 视频质量优秀
  3. 与业内其他主流模型实现无缝衔接
  4. 开源免费,便于开发者使用和二次开发

图片[2]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

 

免费在线试玩:【点击进入】 目测在线人太多需要排队

自己本地搭建教程:

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载:网盘下载

3.安装必备的环境:

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

 

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

 

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

 

ModelscopeT2V作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 40秒 165秒
56帧 75秒 360秒
80帧 110秒 525秒
240帧 340秒 1610 秒(约 27 分钟)
600帧 860秒 5128 秒(约 85 分钟)
1200帧 1710 秒(约 28 分钟) 10225 秒(约 170 分钟)
AnimateDiff作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 50秒 180秒
56帧 85秒 370秒
80帧 120秒 535秒
240帧 350秒 1620 秒(约 27 分钟)
600帧 870秒 5138 秒(~85 分钟)
1200帧 1720 秒(约 28 分钟) 10235 秒(约 170 分钟)
SVD作为基本模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 80秒 210秒
56帧 115秒 400秒
80帧 150秒 565秒
240帧 380秒 1650 秒(约 27 分钟)
600帧 900秒 5168 秒(~86 分钟)
1200帧 1750 秒(约 29 分钟) 10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时,采用随机混合。对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用:【点击前往】 支持多模型自由切换!

THE END
喜欢就支持一下吧
点赞2177 分享
中美隔空较量!宇树科技PK波士顿动力,人形机器人首秀侧空翻,谁更胜一筹? | 零度解说-零度博客
Windows 11 升级以后需要注意什么?如何快速熟悉它?| 零度解说-零度博客
DeepSeek V3.1 和 Claude Opus4.1 、GPT-5 编程挑战题目!及生成的提示词-零度博客

DeepSeek V3.1 和 Claude Opus4.1 、GPT-5 编程挑战题目!及生成的提示词

就在昨天,DeepSeek V3.1 已经悄悄发布!模型已经开源到Huggingface上 【链接直达】,其上下文长度拓展到128k。在编程能力方面表现尤为突出,Aider测试中获得了 71.6%高分,同时推理和响应速度...
admin的头像-零度博客admin
1.2W+1458
在 U盘、移动硬盘上运行 Windows 10 /11 系统所需的工具-零度博客

在 U盘、移动硬盘上运行 Windows 10 /11 系统所需的工具

  1.Rufus :https://rufus.ie 2.Windows 10 官方镜像文件 (根据视频演示下载): https://www.microsoft.com/zh-cn/software-download/windows10 3.Windows 11  原版 ISO :https://www...
显卡缺货什么时候能缓解?AMD苏妈给出了答案 !-零度博客

显卡缺货什么时候能缓解?AMD苏妈给出了答案 !

自从从2020年9月9月RTX 30显卡发布以来,缺货的问题已经困扰了玩家好几个月的时间,进入2021年之后,缺货状况更是有增无减。之所以显卡如此难买,原因是多方面的,但GPU产能跟不上肯定是最重要...
又一个视频生成AI火了:Pika 作为新起之秀非常能打!-零度博客

又一个视频生成AI火了:Pika 作为新起之秀非常能打!

继runway发布了他们的局部动画笔刷,Stability AI 开源了他们的AI视频模型后,另一边的Pika终于发布了他们的视频编辑器,并同时公布了他们获得了5000W美元的投资。 Pika之前早就预告了他们的高...
admin的头像-零度博客admin
1.7W+1682
AI 换脸教程 - 最简单易懂的 Faceswap 换脸视频!完全免费开源 2022 | 零度解说-零度博客
谷歌的黑暗模式变得更暗-零度博客

谷歌的黑暗模式变得更暗

根据最新报道,用户开始看到谷歌全新的漆黑黑暗模式。之前的黑暗模式是一种可以舒缓眼睛的灰色,但谷歌切换到了真正的黑色(#000000),应该在 OLED 和 AMOLED 显示器上真正流行起来。 谷歌本月...
admin的头像-零度博客admin
1.5W+2251
Netflix 的新密码共享规则(以及如何规避这些规则)-零度博客

Netflix 的新密码共享规则(以及如何规避这些规则)

Netflix 正在禁止密码共享的新计划。 我们知道这一天即将到来:Netflix 希望您停止与朋友和家人共享您的帐户,并希望这些用户为自己的帐户付费或根本不流媒体。您可能听说过公司计划打击这种共...
admin的头像-零度博客admin
1.3W+6539