學(xué)者也追星 | 用統(tǒng)計學(xué)分析,解開披頭士歌曲的作者之謎
時間:2018-09-28 14:43 閱讀:1245 整理:市場調(diào)研公司
計量文體學(xué)(stylometry)是一種使用統(tǒng)計學(xué)技術(shù)來確定作者的方法,最著名的案例就是確定“大學(xué)炸彈客”的真身是泰德·卡辛斯基(Theodor Kaczynski),還發(fā)現(xiàn)莎士比亞和克里斯托弗·馬洛(Christopher Marlowe)合作完成了《亨利四世》的劇本。在文本分析的過程中,暴露“幕后主筆”的并非那些不尋常的用詞,而是最常用的詞匯——常用詞匯(如介詞)的反復(fù)出現(xiàn),標(biāo)志了一個人可能的身份。
在愛德華王子島的某次科學(xué)大會上,哈佛大學(xué)的統(tǒng)計學(xué)高級講師馬克·格利克曼(Mark Glickman)和戴爾豪斯大學(xué)的數(shù)學(xué)教授杰森·布朗(Jason Brown)意外發(fā)現(xiàn)對方也是披頭士樂隊(Beatles)的“真愛粉”,他們都想知道計量文體學(xué)的方法能否回答那個爭議不休的問題:這些歌到底是誰寫的,是列儂還是麥卡特尼?
格利克曼解釋說,對于大部分標(biāo)著“列儂-麥卡特尼”的歌曲,大家都清楚,也白紙黑字地寫明,這是兩人中的誰寫的歌。然而,有數(shù)量驚人的歌曲(或者歌曲中某些段落)的作者尚存爭議。例如,沒人知道是誰創(chuàng)作了《In my Life》,這首歌出自 1965 年的專輯《橡皮靈魂》(Rubber Soul),在《滾石》(Rolling Stone)評選的“史上最偉大的 500首 歌曲”中排名第 23 位。列儂和麥卡特尼對這首歌的記憶完全不同。“所以,我們想知道是否能夠使用數(shù)據(jù)分析技術(shù),試圖解開這首歌的創(chuàng)作之謎,看看它到底出自哪位之手?!备窭寺v道。
在哈佛統(tǒng)計學(xué)專業(yè)學(xué)生宋瑞安(音譯,Ryan Song)的幫助下,格利克曼和布朗按照五個特征維度“解構(gòu)”了披頭士從 1962 年到 1966 年的所有歌曲。每個特征維度統(tǒng)計表示歌曲中某一音樂性特征出現(xiàn)的頻率?!耙?yàn)楹茈y通過任何直接的方式將歌曲的音樂內(nèi)容量化出來,所以我們方法背后的主要思想就是將歌曲轉(zhuǎn)為一套不同的數(shù)據(jù)結(jié)構(gòu),通過定量方法給歌曲打上‘標(biāo)簽’,從而進(jìn)行檢驗(yàn)?!备窭寺^續(xù)說道,“試想一下,我們可以將某一種顏色解構(gòu)成紅、綠、藍(lán)三種顏色按一定權(quán)重的組合。我們用同樣的方法來處理披頭士的歌,當(dāng)然其中的成分不止三種。總之,我們的方法將歌曲分解為 149 種成分?!?
“歌曲的第一類特征就是不同常用和弦的使用頻率,以及不常用和弦的集合,”格利克曼解釋說,“我們確定了 11 種和弦類別?!比缓?,他們將旋律音符的特征提取出來,也就是主唱所唱的音符。接下來,他們記錄下和弦轉(zhuǎn)換的頻率,即一個和弦接著另一個和弦出現(xiàn)的頻率。在這里,他們再次將不常用的和弦轉(zhuǎn)換歸入單獨(dú)的分類中。第四步,他們記錄連續(xù)旋律音符對出現(xiàn)的頻率。
最后,他們將歌曲分解為由四個旋律音符組成的“等高線”。格利克曼介紹,“等高線”就是四個旋音符旋律走向的排列順序,分為“上升”、“下降”和“保持不變”。換言之,如果四個音符的走向是音調(diào)逐漸上升,那么其“等高線”就是“上升-上升-上升”,即每兩個連續(xù)音符之間的音調(diào)是上升關(guān)系。格利克曼說,通過研究四音符等高線,能夠獲得額外的細(xì)節(jié),有助于區(qū)分旋律創(chuàng)作的風(fēng)格。
在這里,格利克曼指出,這五個分類維度之所以能夠作為不同音樂創(chuàng)作風(fēng)格的“標(biāo)簽”,是因?yàn)榇蠹叶挤浅J煜づ^士的作曲風(fēng)格:列儂寫的歌通常旋律線起伏變化不大。
“想想列儂的《Help!》,它基本上是這樣,‘當(dāng)我更年輕的時候,比今天要年輕得多的時候’(When I was younger, so much younger than today),音調(diào)的變化不大。旋律會重復(fù)停留在同一個音符上,只在某些短樂句中出現(xiàn)變化。而保羅·麥卡特尼的歌,比如《Michelle》,‘蜜雪兒,我的美人,這幾個字母組合起來多么動聽’('Michelle, ma belle. Sont les mots qui vont très bien ensemble.),這一句的音調(diào)真是迂回曲折?!?
通過音樂性特征來解決未知或者爭議作者問題,我們可以從以下三個步驟了解他們的方法:
首先,他們的模型假定一首歌中 149 個音樂性特征的每一個出現(xiàn)頻率都取決于歌曲作者。以“基音”(tonic,一首歌的主調(diào)和弦)為例,列儂歌曲的基音會有一定的出現(xiàn)頻率,而麥克特尼歌曲中基音出現(xiàn)頻率可能與之不同。
其次,他們使用概率論的一種常用工具“貝葉斯定理”(Bayes rule)來反轉(zhuǎn)概率。換言之,他們先統(tǒng)計作者明確的歌曲中 149 個音樂性特征的頻率,由此建立一個概率模型,再利用這 149 個特征頻率判斷一首歌的作者是列農(nóng)或麥卡特尼的概率。然后,他們使用 70 首已確定作者的列儂-麥卡特尼合作歌曲或者歌曲段落訓(xùn)練這個模型。
最后,他們用經(jīng)過訓(xùn)練的模型判斷作者有爭議的列儂-麥卡特尼合作歌曲或歌曲段落,預(yù)測它的作者是某個人的概率。
“所以,《In My Life》這首歌是麥卡特尼作曲的概率為 .018,也就意味著,列儂才是真正的作者。”麥卡特尼記錯了。但是《The Word》這首歌,格利克曼曾認(rèn)為它肯定是列儂作曲,但是模型預(yù)測結(jié)果告訴他作者幾乎肯定是麥卡特尼。
除了做一個音樂版《誰是真兇》(Whodunnit?,一檔娛樂節(jié)目)之外,這個模型還能有更多的用處嗎?“當(dāng)然,”格利克曼肯定道,“這個技術(shù)可以被推廣到其他地方,我們可以回顧一下流行樂發(fā)展史,把風(fēng)格流變的影響用圖表顯示出來?!?

關(guān)注公眾號
獲取更多行業(yè)資訊
本站文章內(nèi)容以及所涉數(shù)據(jù)、圖片等資料來源于網(wǎng)絡(luò),轉(zhuǎn)載目的在于傳遞更多信息。版權(quán)歸作者所有,文章僅代表作者觀點(diǎn),不代表華夏經(jīng)緯立場。 如涉及侵權(quán),請聯(lián)系管理員刪除。在法律許可的范圍內(nèi),華夏經(jīng)緯(廣州)數(shù)據(jù)科技股份有限公司享有最終解釋權(quán)。
相關(guān)新聞
- 2025消毒碗柜行業(yè)市場運(yùn)營格局及銷售渠道分析
- 2025年人工智能+融合市場:行業(yè)從“單點(diǎn)突破”到“生...
- 2025年防護(hù)鞋行業(yè)現(xiàn)狀與發(fā)展趨勢分析
- 2025在線地圖服務(wù)行業(yè)市場未來發(fā)展趨勢預(yù)測
- 2025年壁畫行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)及投資分析
- 2025年服裝設(shè)計行業(yè)產(chǎn)業(yè)鏈結(jié)構(gòu)及前景預(yù)測
- 2025睫毛膏行業(yè)市場發(fā)展現(xiàn)狀及競爭格局、供需趨勢分...
- 2025年極地機(jī)器人行業(yè)發(fā)展趨勢及產(chǎn)業(yè)鏈結(jié)構(gòu)
- 2025年智能家居產(chǎn)業(yè)鏈全景、現(xiàn)狀與未來發(fā)展趨勢
- “玩”出萬億級產(chǎn)業(yè) 戶外經(jīng)濟(jì)發(fā)展?jié)摿Υ?戶外裝備行...