对于生成式AI,我一直是按照五个模态去进行分类的:
文本、图片、声音、视频、3D。
而声音领域,可能是在我的分类里,我最感兴趣也是最喜欢的一个。
在某一个路演的PPT上,我给声音又拆成了4个细分:
TTS、SVC、AI音效,我都写过,也玩了很久,而生成式AI音乐,是我一直没写过的东西。
不是我没玩,是我觉得这玩意,真的还没到值得去写去推荐的地步。。。
整个AI生成式音乐的代表,那肯定就是SunoAI了。
而且这玩意其实也火过2波了。
第一波是去年3、4月的时候,有一个很火的开源项目叫Bark,就是出自Suno之手,拿了将近32k的星标。
然后就是去年12月21号的时候,为了庆祝《海贼王》动画25周年,海贼王决定重制最开始的东海篇的那60集,然后尾田这货,给海贼王官方发了一首贺曲,叫《YO-HO-HOおれ達海賊》。
这事本身是个好事,但是好死不死的,这曲子是特么拿AI做的,就是用今天的主角Suno出的。。
这曲子大概就是这样,很糙,基本等于没法听的地步。
播放
下一个
打开循环播放
00:00
/
00:00
倍速
语言
多音轨
AirPlay
0
静音播放中,点击
恢复音量
画中画
网页全屏
全屏
你可以 刷新 试试
播放信息
上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-
按住画面移动小窗
然后就被网友一通骂,你这个浓眉大眼的尾田怎么也用AI了。。。传着传着就变成《海贼王》重制版要用AI做了。。。于是骂的更凶了。。。
这个小插曲,还是挺有意思的,也间接的标明,当时的Suno的质量,是真的差。
直到今天,Suno终于上了V3版本。
在我听了很多demo和自己也跑了二十几首后,我觉得,AI音乐的"ChatGPT"时刻,终于到来了。
这是我的一个demo。
播放
下一个
打开循环播放
00:00
/
00:00
倍速
语言
多音轨
AirPlay
0
静音播放中,点击
恢复音量
画中画
网页全屏
全屏
你可以 刷新 试试
播放信息
上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-
按住画面移动小窗
弊端就是Suno最多只能生成2分钟的音乐,所以可以听到最后,会戛然而止直接截断,但是已经比V2好很多了。
但是这个音质、咬字、节奏编排啥的,也都好太多太多了。
发给朋友听,她回了一句是:卧槽,还是好听的。
网址在此:https://app.suno.ai/
点Create就是生成的主页。
主要用两种模式,一个是打开的"Custom Mode",这个是自定义模式,可以自己自定义歌词。
第二种是Instrumental,这个打开后就只会生成没有歌词的纯音乐了。
roll一次是同时出2首歌,一首消耗5积分,所以一次消耗10积分。
免费用户每天有50积分可以玩,可以roll5次出10首歌。
你要是氪金的话也挺便宜,10刀一个月,给2500积分,能玩很久很久。
要生成音乐的话,第一步肯定是写prompt,第二步(纯音乐没有)就是写歌词。
prompt这块,我比较推荐的写法就是:
音乐流派(如Kpop、Heavy Metal)、音乐风格(如Slow、Broadway)、情绪(如悲伤、愤怒)、乐器(如钢琴、吉他)、主题或场景、人声描述(如愤怒的男声、忧伤的女声)
但是说实话,写音乐的prompt对于不懂音乐的人来说,真的难,毕竟什么音乐流派、音乐风格很多都不懂,你咋写啊= =
歌词其实一样的道理,一首歌,正常是有结构的,比如有Verse(主歌)、Chorus(副歌)、有Bridge(快结束的时候经常那个不一样的部分)等等,普通人很多时候再写的时候也一脸懵逼,这特么咋写。。
别说大家,其实我去年刚玩Suno的时候,一样也是一脸懵逼。
让大家去现学我觉得也不现实。。。
那AI的方式,就必须用AI去解决,你说对吧。
所以,我就随手写了一个Prompt,让大模型来给你写歌曲Prompt和歌词。
什么玩意都给你弄好,你自己复制即用。就像这样:
这个Prompt长这样:
#01 你是歌词大师XX,现在,我需要你帮我写一段XX歌词,描述的是一个XX故事,整体歌曲时长2分钟以内,要押韵,要有文学气质,副歌部分要进行跨行重复。请按以下结构帮我创作:
"""
[instrumental intro]
[Verse 1]
<歌词>
[Chorus]
<歌词>
[Verse 2]
<歌词>
[Chorus]
<歌词>
[Bridge]
<歌词>
[Guitar solo]
[Chorus]
<歌词>
[Outro]
[End]
"""
#02 输出歌词以后,再根据歌词和故事内容,以英文词组的形式再给出歌曲的prompt。
请按以下格式帮我输出英文prompt:
"""<音乐流派(如Kpop、Heavy Metal)>、<音乐风格(如Slow、Broadway)>、<情绪(如悲伤、愤怒)>、<乐器(如钢琴、吉他)>、<主题或场景>、<人声描述(如愤怒的男声、忧伤的女声)>"""
直接拿去复制开箱即可用。
然后就直接把出来的结果,全都复制粘贴进去,当然,你也可以自己改吧改吧。
都扔进去之后,点那个黄的btn,直接开跑,速度挺快的,大概几十秒就出来了。
说实话,这个出来男声,让我有点心动了。。。。
播放
下一个
打开循环播放
00:00
/
00:00
倍速
语言
多音轨
AirPlay
0
静音播放中,点击
恢复音量
画中画
网页全屏
全屏
你可以 刷新 试试
播放信息
上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-
按住画面移动小窗
当然,出来的歌,你不仅可以拿去直接发,你还可以玩一些骚操作,比如配合SVC,分离换声,换成自己的,可以参考这篇教程:
AI唱歌之终极喂饭教程 - SVC的极限就在这了
更多的歌,大家可以自己去Suno上跑着玩,体验一下AI音乐的魅力,这种直出的感觉,还是非常爽的。
虽然对很多专业歌手或者专业制作人来说,可能觉得还偏玩具,可控性差,不好编辑等等。
但至少,一定达到了大多数普通人的水准。
且这个趋势,一定是一个不可逆的未来。
这股子风,现在,终于到了音乐。
AI音乐的"ChatGPT"时刻,我觉得,终于到来了。