最新超长AI视频模型!一句话即可生成120秒视频,免费开源!

图片[1]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

  1. 生成时长达2分钟(1200帧),超越以往模型
  2. 视频质量优秀
  3. 与业内其他主流模型实现无缝衔接
  4. 开源免费,便于开发者使用和二次开发

图片[2]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

 

免费在线试玩:【点击进入】 目测在线人太多需要排队

自己本地搭建教程:

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载:网盘下载

3.安装必备的环境:

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

 

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

 

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

 

ModelscopeT2V作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 40秒 165秒
56帧 75秒 360秒
80帧 110秒 525秒
240帧 340秒 1610 秒(约 27 分钟)
600帧 860秒 5128 秒(约 85 分钟)
1200帧 1710 秒(约 28 分钟) 10225 秒(约 170 分钟)
AnimateDiff作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 50秒 180秒
56帧 85秒 370秒
80帧 120秒 535秒
240帧 350秒 1620 秒(约 27 分钟)
600帧 870秒 5138 秒(~85 分钟)
1200帧 1720 秒(约 28 分钟) 10235 秒(约 170 分钟)
SVD作为基本模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 80秒 210秒
56帧 115秒 400秒
80帧 150秒 565秒
240帧 380秒 1650 秒(约 27 分钟)
600帧 900秒 5168 秒(~86 分钟)
1200帧 1750 秒(约 29 分钟) 10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时,采用随机混合。对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用:【点击前往】 支持多模型自由切换!

THE END
喜欢就支持一下吧
点赞2177 分享
特斯拉首席执行官:埃隆马斯克推出原型人形擎天柱机器人-零度博客

特斯拉首席执行官:埃隆马斯克推出原型人形擎天柱机器人

特斯拉首席执行官埃隆马斯克透露了一个人形“擎天柱”机器人的原型,该机器人与汽车的自动驾驶辅助功能共享一些人工智能软件和传感器。在特斯拉 2022 年人工智能日演讲开始时,马斯克承认他们去...
admin的头像-零度博客admin
1.6W+1682
【零度解说】 2022年 最后一次重要的分享! 希望大家都开开心心迎接崭新的一年!!-零度博客
OpenAI 再次震撼世界!推出全新 Sora 技术, 简直是AI视频的颠覆性革命!我们离实现AGI更近了.... | 零度解说-零度博客

OpenAI 再次震撼世界!推出全新 Sora 技术, 简直是AI视频的颠覆性革命!我们离实现AGI更近了…. | 零度解说

https://youtu.be/7rB0lPvtXuo?si=hqKtcc6EAcnbA_El =============== OpenAI Sora 体验入口:https://www.freedidi.com/11604.html
admin的头像-零度博客admin
1.3W+1527
Windows 11  新功能探索,这样的系统你喜欢吗? | 零度解说-零度博客
在 Windows 7/8/10 电脑上开启sudo命令-零度博客

在 Windows 7/8/10 电脑上开启sudo命令

在最新的Windows 11 24H2版本已经内置了sudo功能,但是其实也可以在Windows 7、8、10、11 正式版上开启! 在Windows电脑上开启Sudo: 1. 复制 sudo.exe 至  %windir%\System32 文件夹下 2. 以...
admin的头像-零度博客admin
1.4W+1528
网站推荐一波,这7个都不常见!但确实好玩又实用!!-零度博客

网站推荐一波,这7个都不常见!但确实好玩又实用!!

1.Upscayl 是一款免费开源的图片无损放大工具,支持 Windows、Mac 和 Linux 系统。 它内置了多款 AI 模型,可以对低分辨率、模糊图片进行修复,并放大 4~8 倍,变成高清大图。 【链接直达】 2.P...
admin的头像-零度博客admin
2.2W+1683
HARDiNFO 8 Professional – 免费获取专业系统信息查看工具 [Windows][$39.5→免费]-零度博客

HARDiNFO 8 Professional – 免费获取专业系统信息查看工具 [Windows][$39.5→免费]

HARDiNFO Professional 是一款功能强大的系统信息查看工具,可详细展示当前电脑中各硬件的具体信息,以及系统、网络等参数。此外,它还内置了实用的跑分功能,让您轻松评估设备性能。   &n...
admin的头像-零度博客admin
2.9W+2816
谷歌浏览器必备的10款油猴插件神器!有福利!Chrome,Edge等有了它们才算完美 | 零度解说-零度博客
Chrome OS Flex 是数百万无法运行 Windows 11 的 PC 的理想选择-零度博客

Chrome OS Flex 是数百万无法运行 Windows 11 的 PC 的理想选择

2025 年 10 月 14 日标志着对 Windows 10 家庭版和专业版的支持和安全更新的结束。这意味着对于不满足Windows 11 硬件要求的 Windows PC,官方保证的功能和安全更新也将结束。 从 2022 年初开始...
admin的头像-零度博客admin
1.6W+2253