最新超长AI视频模型!一句话即可生成120秒视频,免费开源!

图片[1]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

近日,由Picsart AI Research团队联合发布的StreamingT2V模型可生成长达2分钟(1200帧)的高质量视频,超越了之前的Sora模型。这一开源模型不仅可以生成更长时长的视频,还能与SVD、animatediff等其他模型无缝兼容,为开源视频生成领域带来新的突破。

亮点总结:

  1. 生成时长达2分钟(1200帧),超越以往模型
  2. 视频质量优秀
  3. 与业内其他主流模型实现无缝衔接
  4. 开源免费,便于开发者使用和二次开发

图片[2]-最新超长AI视频模型!一句话即可生成120秒视频,免费开源!-零度博客

 

免费在线试玩:【点击进入】 目测在线人太多需要排队

自己本地搭建教程:

1.安装并安装 Python 3.10 and CUDA >= 11.6 环境 【Python 3.10 】、【Cuda 下载

2.克隆开源项目至本地:

git clone https://github.com/Picsart-AI-Research/StreamingT2V.git
cd StreamingT2V/

StreamingT2V 最新版打包下载:网盘下载

3.安装必备的环境:

conda create -n st2v python=3.10
conda activate st2v
pip install -r requirements.txt

4.(可选)如果您的系统上缺少 FFmpeg,请安装 FFmpeg

 

conda install conda-forge::ffmpeg

5. 从HF 下载模型权重并将它放在 t2v_enhanced/checkpoints目录下

 

6.文本转视频

cd t2v_enhanced
python inference.py --prompt="A cat running on the street"

如要使用其他基本模型,请添加--base_model=AnimateDiff参数。用于python inference.py --help更多选项

7.图片转视频

cd t2v_enhanced
python inference.py --image=../__assets__/demo/fish.jpg --base_model=SVD

推理时间

 

ModelscopeT2V作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 40秒 165秒
56帧 75秒 360秒
80帧 110秒 525秒
240帧 340秒 1610 秒(约 27 分钟)
600帧 860秒 5128 秒(约 85 分钟)
1200帧 1710 秒(约 28 分钟) 10225 秒(约 170 分钟)
AnimateDiff作为基础模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 50秒 180秒
56帧 85秒 370秒
80帧 120秒 535秒
240帧 350秒 1620 秒(约 27 分钟)
600帧 870秒 5138 秒(~85 分钟)
1200帧 1720 秒(约 28 分钟) 10235 秒(约 170 分钟)
SVD作为基本模型

 

帧数 更快预览的推理时间 (256×256) 最终结果的推理时间 (720×720)
24帧 80秒 210秒
56帧 115秒 400秒
80帧 150秒 565秒
240帧 380秒 1650 秒(约 27 分钟)
600帧 900秒 5168 秒(~86 分钟)
1200帧 1750 秒(约 29 分钟) 10265 秒(~171 分钟)

所有测量均使用 NVIDIA A100 (80 GB) GPU 进行。当帧数超过 80 时,采用随机混合。对于随机混合,chunk_size和 的值overlap_size分别设置为 112 和 32。

更多的文生视频在线使用:【点击前往】 支持多模型自由切换!

THE END
喜欢就支持一下吧
点赞2177 分享
一口吞掉大白鯊的怪物,海底是否真的還存在史前巨獸 | 零度解密-零度博客

一口吞掉大白鯊的怪物,海底是否真的還存在史前巨獸 | 零度解密

澳洲的一個鯊魚研究團隊,在跟踪研究一條5米多長大白鯊的時候,突然被深海裡的一種神秘的未知巨獸,一口吞掉,頓時震驚了整個研究團隊,後來他們對這個超級掠食者,展開了長達半年多的追踪和調...
Chrome OS Flex 是数百万无法运行 Windows 11 的 PC 的理想选择-零度博客

Chrome OS Flex 是数百万无法运行 Windows 11 的 PC 的理想选择

2025 年 10 月 14 日标志着对 Windows 10 家庭版和专业版的支持和安全更新的结束。这意味着对于不满足Windows 11 硬件要求的 Windows PC,官方保证的功能和安全更新也将结束。 从 2022 年初开始...
admin的头像-零度博客admin
1.6W+2253
Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!

Langchain-Chatchat 是一个可以实现:完全本地化推理的知识库增强方案, 重点解决数据安全保护,私域化部署的企业痛点。 开源方案采用Apache License,可以免费商用,无需付费。 支持市面上主流...
admin的头像-零度博客admin
2.1W+2177
入侵手机!它的原理是什么?又该如何做到防范!-零度博客
DeepSeek-R1 实测 + 本地部署教程!最强开源AI大模型,完全免费,实力媲美OpenAI-O1 | 零度解说-零度博客

DeepSeek-R1 实测 + 本地部署教程!最强开源AI大模型,完全免费,实力媲美OpenAI-O1 | 零度解说

https://www.youtube.com/watch?v=tc84i2MM1b4   DeepSeek-R1 大模型下载+部署工具:https://www.freedidi.com/18341.html    
完美解决电脑图片、视频不显示缩略图的问题! K-Lite 编解码器包-零度博客

完美解决电脑图片、视频不显示缩略图的问题! K-Lite 编解码器包

K-Lite 编解码器包有四种不同的变体。范围从仅包含最基本解码器的非常小的捆绑包到大型且更全面的捆绑包。变体之间的全局差异可以在下面找到。具体差异可以通过能力对比和内容页面对比来发现。 ...
admin的头像-零度博客admin
1.4W+1527
免费注册Amazon云服务器!并搭建网站、博客等-零度博客

免费注册Amazon云服务器!并搭建网站、博客等

  1.Amazon免费注册链接:【点击前往】 2.安装docker : curl -fsSL https://get.docker.com | sh 3.安装docker-compose: sudo apt-get install composer   4.创建wordpress文件夹并...
admin的头像-零度博客admin
1.4W+1528
历时1年!英特尔终于找到13/14代CPU 不稳定原因, 受影响用户可联系更换-零度博客

历时1年!英特尔终于找到13/14代CPU 不稳定原因, 受影响用户可联系更换

经过近一年的调查,英特尔终于找到了第 13/14 代桌面处理器在某些情况下出现不稳定甚至崩溃的原因。这些问题通常在用户玩游戏或运行高负载任务时出现,严重影响了用户的使用体验。 最初,英特尔...
Alger Music Player 开源的第三方音乐播放器!支持跨平台使用-零度博客

Alger Music Player 开源的第三方音乐播放器!支持跨平台使用

Alger Music Player 是一个免费开源的第三方音乐播放器、本地服务、桌面歌词、音乐下载、最高音质,支持跨平台使用,而且有网页版、Windows、Linux 和 macOS 客户端,可以显示歌词、支持下载,...
admin的头像-零度博客admin
2.1W+2757