科技日報實習記者?張佳欣
過去幾年里,人工智能(AI)在創(chuàng)意領域的應用出現了爆炸性增長。新一代圖像和文本生成器不斷給人驚喜?,F在,AI正在下一個領域掀起浪潮。
圖片來源:英國 DJ Mag 網站
近期,谷歌的一個研究團隊發(fā)布了新的AI模型MusicLM,這是一種可將文本信號轉換為音頻片段的音樂生成器。繼ChatGPT之后,音樂或將成為AI生成的前沿領域。這是創(chuàng)意AI在短短幾年內創(chuàng)新步伐飛速的又一個例子。
傳統(tǒng)音樂行業(yè)仍在適應互聯網和流媒體服務帶來的巨大沖擊,AI會改變人們創(chuàng)作和體驗音樂的方式,使音樂行業(yè)再次復興嗎?
把文字變音樂的AI“藝術家”
最近爆火的聊天機器人ChatGPT或許還無法制作音樂,但谷歌的MusicLM可以。
這一AI“藝術家”可根據不同地點、時代或要求創(chuàng)作音樂。其樣本由指定音樂流派、音樂氣氛甚至特定樂器的長段旋律組成。
當MusicLM“聽到”某人吹口哨、哼唱、演唱或是演奏樂器后,能從中推斷出額外的旋律小節(jié)。它可調節(jié)樂器的種類,甚至是演奏的力度。它還可創(chuàng)建一曲連續(xù)音樂即興表演的“故事”,例如創(chuàng)作“在電子游戲中播放的電子歌曲”“在河邊播放的冥想歌曲”、表達意境為“火”和“煙花”等音樂。
MusicLM甚至可產生適合視覺藝術的聲音。例如,它根據薩爾瓦多·達利的名畫《記憶的永恒》和雅克-路易·大衛(wèi)的《跨越阿爾卑斯山圣伯納隘道的拿破侖》的描述創(chuàng)建了配樂。
MusicLM可以產生適合視覺藝術的聲音。例如它根據薩爾瓦多·達利的《記憶的永恒》和雅克-路易·大衛(wèi)的《跨越阿爾卑斯山圣伯納隘道的拿破侖》的描述創(chuàng)建了配樂。
圖片來源:美國在線媒體Voicebot.ai
AI生成音樂史上的重要突破
AI生成音樂有著悠久的歷史,甚至被認為是創(chuàng)作熱門歌曲和助力現場表演的“功臣”。
在MusicLM之前,已經有其他嘗試利用AI生成音樂的嘗試,比如谷歌發(fā)布的AudioML和OpenAI的Jukebox,視覺和聲音AI項目Riffusion則使用穩(wěn)定擴散將文本提示轉換為聲圖。還有一些AI工具可將生成式AI和音樂結合在一起,比如Voicesmod的合成歌曲生成器,它可將提交的歌詞與一系列流行歌曲和AI聲音進行匹配。
不過,谷歌研究人員在論文中也提到了AI音樂生成面臨的各種挑戰(zhàn)。相比從文本到圖像的機器學習,缺乏配對的音頻和文本數據是一大障礙。此外,音樂是“沿著時間維度”構建的,讓AI了解文本表達的意圖,創(chuàng)作出一段符合主題的持續(xù)的音樂要困難得多。
MusicLM是克服挑戰(zhàn)的重要一步。據極客邦科技網站報道,MusicLM將有條件的音樂生成過程建模,變?yōu)榉謱有蛄械叫蛄薪?,也就是說,它使用機器學習為歌曲的不同層次生成序列,如結構、旋律和單獨的聲音,并在幾分鐘內以恒定的24千赫茲創(chuàng)建音樂。
AI會取代人類創(chuàng)作音樂嗎
目前,自動化創(chuàng)作音樂的技術已經在快速發(fā)展。AI工具可能會給藝術家提供更好的靈感。
但眾所周知,機器學習技術如同一個非常難以預測的“盲盒”。澳大利亞《對話》雜志發(fā)文稱,使用AI生成音樂只是目前的一次“幸運的探險”。使用這些工具時,人們有時可能會發(fā)現黃金,但不知其中的原理是什么。藝術家們現在不得不接受“潘多拉魔盒”已經被打開的現實,就像當初合成器和電子鼓第一次出現時一樣,在某些情況下,它可能會部分取代對音樂家的需求。
但目前,MusicLM還無法與人類作曲家匹敵,尤其是在歌詞創(chuàng)作方面。美國專注于語音智能的在線媒體Voicebot.ai評論稱,MusicLM生成的歌詞充其量只是亂碼,甚至是在胡謅。谷歌研究人員也承認,MusicLM大約1%的創(chuàng)作內容只是在單一地復制現有的音樂。
因擔心版權風險以及道德問題,谷歌表示目前沒有立即發(fā)布MusicLM的計劃。有法律版權專家表示,AI系統(tǒng)音樂可被視為衍生作品,在這種情況下,只有原創(chuàng)元素才會受到版權保護。不過,如果藝術家的作品在其不知情或未經他們同意的情況下被用來訓練AI系統(tǒng),那么AI音樂生成器還可能面臨涉及侵權的訴訟。如果沒有監(jiān)管,這很可能成為音樂行業(yè)的另一個灰色地帶。