Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!

图片[1]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

AI 圈又有大新闻啦!Stability AI 又悄悄放出一个大招,这次不再是画图,而是音乐生成!而且还是开源的!

这个新工具叫 Stable Audio Open,简单来说,用文字就能生成各种音频——无论是鼓点、旋律,还是环境音效,全都不在话下!最最最重要的是,它还能为 Sora 和可灵 这些视频生成配音!接下来我介绍3种使用方法

1.最简单在线使用

Stable Audio 2.0

点击前往

 

图片[2]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

 

2.本地一键安装包:点击下载】,适合新手,低配的电脑也能运行,但是效果没有第3种好!
图片[3]-Stability AI 偷偷发布黑科技,秒杀Suno AI 的音乐生成!-零度博客

3.手动安装

首先,将存储库克隆到本地机器:

git clone https://github.com/RoyalCities/RC-stable-audio-tools.git
cd RC-stable-audio-tools

创建虚拟环境

Windows :

python -m venv venv
venv\Scripts\activate

macOS 和 Linux:

python3 -m venv venv
source venv/bin/activate

安装所需的软件包

安装稳定的音频工具和必要的软件包setup.py

pip install stable-audio-tools
pip install .

 

Windows 用户的额外步骤

 

为了确保 Gradio 使用 GPU/CUDA 而不是默认使用 CPU,请卸载并重新安装torch、,torchvisiontorchaudio使用正确的 CUDA 版本:

pip uninstall -y torch torchvision torchaudio
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

配置

 

config.json根目录中包含一个示例。对其进行自定义以指定自定义模型和输出的目录(.wav 和 .mid 文件将存储在此处):

{
    "model_directory": "models",
    "output_directory": "generations"
}

使用方法

 

🎚️ 运行 Gradio 界面

 

使用批处理文件或直接从命令行启动 Gradio 界面:

  • 批处理文件示例:

@echo off
cd /d path-to-your-venv/Scripts
call activate
cd /d path-to-your-stable-audio-tools
python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt
pause

或命令行:

python run_gradio.py --model-config models/path-to-config/example_config.json --ckpt-path models/path-to-config/example.ckpt

🎶 生成音频和 MIDI

 

Gradio 界面中的输入提示会生成音频和 MIDI 文件,这些文件将按照 中指定的方式保存config.json

该界面已经扩展了 Bar/BPM 设置(可修改用户提示 + 样本长度条件)、MIDI 显示 + 转换,还具有动态模型加载功能。

模型必须与附带的配置文件一起存储在其自己的子文件夹中。即,一次微调可以有多个检查点。所有相关检查点都可以放在同一个“model1”子文件夹中,但重要的是,它们的相关配置文件包含在与检查点本身相同的文件夹中。

要切换模型,只需使用下拉菜单选择要加载的模型,然后选择“加载模型”。

 

THE END
喜欢就支持一下吧
点赞2176 分享
AI 秒生爆款神曲,Suno 让人人都能成为音乐家!-零度博客

AI 秒生爆款神曲,Suno 让人人都能成为音乐家!

只要在框中输入提示,片刻之后,一段完全符合你要求的逼真、高保真的音乐片段就开始自动播放了。 你不需要任何门槛。现在,不懂任何乐理知识的人,就能创作出一段抓耳的音乐,甚至可能成为抖音...
admin的头像-零度博客admin
1.4W+1528
WirelessMon 功能丰富的WiFi信号检测工具-零度博客

WirelessMon 功能丰富的WiFi信号检测工具

使用 WirelessMon 监控 wi-fi 适配器的状态并实时收集有关附近接入点和热点的信息。 WirelessMon 提供信号电平和实时 IP 以及 802.11 WiFi 统计数据的综合图表。它可以将收集到的所有无线信息记...
admin的头像-零度博客admin
1.9W+2252
Captura最新安装教程, 解决FFmpeg无法下载的问题-零度博客

Captura最新安装教程, 解决FFmpeg无法下载的问题

由于Captura内置的FFmpeg下载节点挂了所以如果你直接安装的话会出现这个错误:远程服务器返回错误:(503)服务器不可用要解决这个问题其实是很简单的 1,首先我们直接去FFmpeg官网下载FFmpeg手动配...
[限免] RealRadio - iOS 收音机应用,畅享电台直播-零度博客

[限免] RealRadio – iOS 收音机应用,畅享电台直播

RealRadio 是一款充满复古风格的拟物化收音机应用,完美融合经典与现代功能。它不仅支持小组件,兼容 Apple Watch 和 CarPlay,还允许你轻松添加自己喜欢的电台链接,并提供收藏功能,方便你随...
admin的头像-零度博客admin
2.1W+1831
美国硅谷银行倒闭后,USDC 稳定币和加密货币市场失控-零度博客

美国硅谷银行倒闭后,USDC 稳定币和加密货币市场失控

USDC 通常稳定的价格从 1 美元跌至 0.89 美元,而以太坊汽油费在这家加密银行倒闭数小时后飙升。 周六早些时候,由于硅谷银行 (SVB) 的倒闭导致该行业的一些核心管道失灵,加密货币危机进入高潮...
admin的头像-零度博客admin
1.2W+6539
入侵手机!它的原理是什么?又该如何做到防范!-零度博客
Gmail 焕然一新:变化如下-零度博客

Gmail 焕然一新:变化如下

Gmail 正在获得新的集成视图布局。这是正在发生变化的所有内容以及谁可以访问它。     Gmail 并不以更频繁地改进外观而闻名。然而,自 2020 年进行重大设计大修以来,谷歌准备通过引...
admin的头像-零度博客admin
1.5W+2251
Windows 11 版本 22H2 太阳谷版本更新!新功能、发布日期:你需要知道的一切-零度博客

Windows 11 版本 22H2 太阳谷版本更新!新功能、发布日期:你需要知道的一切

  Windows 11 将获得微软在 2021 年正式发布时确认的年度更新。预定于明年发布的 Windows 11 更新将是 22H2 版本。根据一份新报告,此更新将带回非常需要且当前缺少的任务栏功能。它还可能...
admin的头像-零度博客admin
1.7W+2250
Linux领域迎来坏消息!2021年恶意软件感染增加10倍-零度博客

Linux领域迎来坏消息!2021年恶意软件感染增加10倍

新的一年刚刚开始,遗憾的是Linux平台的用户和爱好者首先要面对的是一条坏消息。根据网络安全公司CrowdStrike发布的一份报告,2021年针对Linux的恶意软件与前一年相比增加了35%。 更具体地说,...
admin的头像-零度博客admin
1.5W+2251