[返回电脑前线首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]
简单指令就能生成完整音乐!Stability AI发布音频大模型2.0
送交者: gonewithsmoke[☆★★★声望勋衔15★★★☆] 于 2024-04-05 19:08 已读 10950 次  

gonewithsmoke的个人频道

6park.com

还在为想听音乐时,无法找到喜欢的歌而烦恼?现在你可以在几分钟内做一首自己的专属歌曲。 6park.com

最近,由于生成式 AI 技术的显著进步,生成音乐成为下一个追逐的热点。前有广受好评的 Suno,国内大模型厂商也有跟进。北京时间 4 月 3 日,开源生成式 AI 公司 Stability AI 宣布推出音频生成模型 Stable Audio 2.0。此前的 1.0 版本于 2023 年 9 月首次亮相,被《时代》杂志评为 2023 年最佳发明之一。 6park.com

当前 AI 生成音乐的实现主要依赖于深度学习技术,就像语言模型是在大量文本上训练一样,音频模型通过训练大量的音乐数据来使 AI 能够理解音乐的结构、风格和创作规律,进而生成新的音乐。 6park.com

根据 Stability AI 的官方博文,Stable Audio 2.0 使用了 AudioSparx 的数据进行训练,这些数据包含了超过 80 万个音频文件,涵盖了音乐、声效和单独乐器的声音素材,以及相应的文字描述信息。 6park.com

Stable Audio 2.0 能够仅凭自然语言描述,生成长达三分钟的完整音乐,而且是高质量的 44.1 kHz 立体声。这个数字表示的是音频信号的采样频率,采样率越高,越能够捕捉更细微的声波变化,录制的声音也就越接近原始声音。44.1 kHz 是 CD 音质标准的采样率,能够提供较高的音频质量。 6park.com

除了用文本直接生成音乐,用户也可以先上传一段音频,再用文字描述想要的效果,Stable Audio 2.0 就能按指示改造该音频,也就是拥有音频到音频的转换能力。此外,它还能生成特定的音效,创作形式十分灵活。 6park.com

6park.com

图 | Stable Audio 2.0 用户界面(来源:官网) 6park.com

具体使用上,在提示词 (Prompt)部分输入想要生成音乐的关键词,然后点击下方的“Generate”即可开始生成。免费版用户每月可以生成 10 次,再想多用每月需要至少付费 11.99 美元。 6park.com

值得注意的是,Stable Audio 2.0 暂时还不支持歌词。为了全面测试 AI 生成音乐的水平,这里需要提及另一款 AI 音乐产品 Suno。 6park.com

Suno 在今年 3 月底迎来一次重要升级,最新的 V3 版本被广泛认为是音乐届的“ChatGPT 时刻”。它能够在几秒钟内制作不同风格和流派的歌曲,效果几乎可以和人类创作的音乐相媲美。Suno 在此前公告中还提到,V4 版已经在开发中,会有一些令人兴奋的新功能。 6park.com

6park.com

图 | Suno 用户界面(来源:官网) 6park.com

Suno 对用户相对更友好,每天可以免费使用 5 次。一次生成两首歌。歌曲时长为 2 分钟。有两种使用方法,一种是输入歌词后,再输入音乐类型、主题就能生成歌曲,另一种是生成纯音乐,只需要用文字描述你想要的歌曲即可。 6park.com

时至清明,笔者试以清明节必读诗词《清明》为蓝本,进行实际测试,看下效果,并与不久前同样迎来升级的 AI 音乐产品 Suno 做个对比。如果之前没有接触过 AI 音乐,你一定会为它的表现而惊讶。首先我用 ChatGPT 将唐诗《清明》进行了改编,以生成歌词。将歌词输入 Suno,短暂等待后,即可生成歌曲。效果如下: 6park.com

实际效果还是相当不错的。接下来,用相近的提示词使用 Stable Audio 2.0 来生成音乐。效果如下: 6park.com

2 清明雨纷飞,问芯Voice,3分钟 6park.com

Stable Audio 2.0 的效果,个人不太满意。不过在音乐上见仁见智,也可以实际上手测试下效果。 6park.com

值得一提的是,除了以上两款产品,近日,国内也出了一款音乐大模型工具天工 SkyMusic,可以在天工 APP 进行试用(目前需要加微信群获取邀请码,在软件界面即可操作)。其用户界面如下: 6park.com

6park.com

输入歌词后可以直接生成音乐,也可以选择一首现有歌曲作为参考来生成,一次生成 3 首歌,时长在 90 秒左右。这里先用刚才生成的《清明雨纷飞》歌词直接生成,其中一首相对较好的效果如下: 6park.com

然后,搭配参考音乐后再次生成。参考音乐为上面 Suno 生成的歌曲。效果如下: 6park.com

有了参考音乐后,新生成的音乐个人感觉是上了一个档次,3 首效果都还可以。 6park.com

总的来说,以上三款产品,Suno 的效果无疑是最好的,可以做到以假乱真的地步(歌词写得再好点,效果应该会更进一步)。不过,Suno 当前仍有一个问题,就是生成的音乐不完整,在两分钟时总会戛然而止,结束得很突然。 6park.com

不管怎么说,可以预见不远的将来,AI 音乐定会蔚然成风,可以大规模商用。比如,影视剧中的背景音乐可以通过 AI 快速、高效地制作,以满足特定场景的情绪需求。而在音乐市场,根据用户的听歌历史和偏好,AI 可以创作个性化音乐,为我们提供更加定制化的听歌体验。音乐市场的消费模式或迎来转变。 6park.com

随着 AI 在内容生成上不断地“攻城略地”,从文本到视频,AI 可以极大丰富人类的创造力,让每个人都能成为创作者。这不仅可以让艺术家发现新的创作方法,也让普通人有了成为艺术家的可能性。 6park.com

人工智能在当下毫无疑问已经成为创新的前沿。技术的进步让 AI 能够接近理解和模拟人类的创造过程。AI 可以作为工具,帮助人们实现创意的无限扩展。这种应用挑战了我们对艺术创作的传统认知,也引发了关于创造力、艺术价值和作者身份的深刻讨论。但不可否认的是,AI 在内容生成领域的应用开启了人类创造力的新篇章。 6park.com

头图:DALL·E 生成「清明节」
喜欢gonewithsmoke朋友的这个贴子的话, 请点这里投票,“赞”助支持!
[举报反馈]·[ gonewithsmoke的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回电脑前线首页]
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖:        ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


    用户名:密码:[--注册ID--]

    标 题:

    粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


         图片上传  Youtube代码器  预览辅助

    打开微信,扫一扫[Scan QR Code]
    进入内容页点击屏幕右上分享按钮

    楼主本栏目热帖推荐:

    >>>>查看更多楼主社区动态...






    [ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]