AI配音情緒節(jié)奏全有 配音員會被取代嗎?
(資料圖片)
人工智能是挑戰(zhàn),但更多的是新機(jī)會。圖據(jù)CFP
肚子餓到咕咕叫,周圍突然產(chǎn)生噪音,這大概是音頻主播不在專業(yè)錄音室,卻需要工作時最怕發(fā)生的事情。日前,從事配音工作十余年的宋琪(化名)告訴華西都市報、封面新聞記者:“如果麥克風(fēng)質(zhì)量尚佳且收聲不錯,這些雜音就會被一同收錄進(jìn)配音作品中,這時配音相當(dāng)于白費(fèi)功夫。”
然而,周遭或人為產(chǎn)生的任何噪音都不會影響到AI配音。
配音員會被AI取代嗎?
不久前,“科大訊飛”在其視頻號發(fā)布了語音技術(shù)AI合成聲配音的短片《雨水》,這也被稱為AI合成聲繼微軟云希、曉曉聲音之后,在諸多細(xì)節(jié)上的突破。
而這段人工智能制作的《雨水》,再次引發(fā)了人們關(guān)于配音專業(yè)的危機(jī)論。進(jìn)入人工智能時代,AI已在悄然改變我們的生活,配音行業(yè)自然也難以幸免。“不知道五年后,我還能不能從事這份工作。”宋琪說,資深配音員會在配音中追求聲音的特質(zhì),但因?yàn)槭芟抻诋嬅婧臀陌福茈y完全表達(dá)自己的個性,容易形成聲音符號化,表達(dá)形式呈現(xiàn)過于理性的固化特性,而學(xué)習(xí)功能強(qiáng)大的AI恰恰可以利用大數(shù)據(jù)分析輸入樣板輕松模仿完成。
“如果一個角色情緒起伏比較大,比如主人公在父親去世后哭泣,那我必須在配音中傳達(dá)出那些情緒,但這種情緒是需要醞釀的,如果今天我的狀態(tài)不佳,那么配出來的音就會不真實(shí)。”宋琪表示,幾年前人工智能的配音還比較生硬,自己也從未考慮過AI會威脅到職業(yè)生涯。“但這兩年,通過相關(guān)技術(shù)的升級,通過不斷學(xué)習(xí)不同情緒的聲音來優(yōu)化的AI配音作品,情緒到位,配音過程迅速又便捷,確實(shí)讓我有種職業(yè)發(fā)展的焦慮。”
為何選擇AI配音?
在表現(xiàn)形式單一的配音領(lǐng)域,由于可以較好地模擬真人的聲音,AI逐漸展露出在配音方面極高的商業(yè)價值。
據(jù)外媒報道,密歇根大學(xué)出版社的有聲讀物,每年出版大約100本學(xué)術(shù)書籍——由學(xué)校為學(xué)者或?qū)W生出版。然而,為一本可能只賺幾百美元的書聘請一名解說員的費(fèi)用可能高達(dá)6000美元,更不用說密集的生產(chǎn)過程了。根據(jù)ACX(亞馬遜的有聲讀物創(chuàng)作交易所)的說法,一小時的有聲讀物,人工制作需要大約六個小時。
對于規(guī)模較小的作者和出版商而言,制作有聲讀物的時間和成本可能無法承受,而AI配音可以改變這一點(diǎn)。
復(fù)制或克隆一個人的聲音,最常用到的一項(xiàng)技術(shù)叫Deepfake Voice,也稱語音克隆或合成語音,其目的是使用AI生成一個人的語音。但簡單來說,合成語音就是計算機(jī)生成的語音,也叫語音合成,一般是通過人工智能(AI)和深度學(xué)習(xí)來實(shí)現(xiàn)的。
目前,Deepfake Voice這項(xiàng)技術(shù)已經(jīng)發(fā)展到可以在音調(diào)和相似度上非常準(zhǔn)確地復(fù)制人聲的地步,一些頭部互聯(lián)網(wǎng)企業(yè)在AI調(diào)音方面也已經(jīng)能做到很高相似程度的聲線模仿。并且,隨著最新AI技術(shù)的引入,只使用一些目標(biāo)聲音的特征,比如語音波形,也可以進(jìn)行更深入的分析和提取。
因此根據(jù)AI配音發(fā)展的現(xiàn)狀來看,它已經(jīng)能為很多需要配音的工作解決不少麻煩,比如配音演員的選擇,各種影視劇和游戲里不同的角色需要不同特征的聲線,而AI配音技術(shù)就能滿足這一需求,一些配音軟件僅需5秒就轉(zhuǎn)換出作品所需要的聲線和配音內(nèi)容。
當(dāng)AI入局配音市場之后
有聲讀物市場火爆,也讓科技公司爭先恐后地進(jìn)行行業(yè)布局。據(jù)公開數(shù)據(jù)顯示,2022年有聲讀物產(chǎn)品在歐美銷售額猛增25%,收入超過15億美元。
根據(jù)相關(guān)機(jī)構(gòu)報告預(yù)測,到2030年,有聲讀物市場預(yù)計將達(dá)到335億美元,高于2021年的約42億美元。伴隨播客在全球的日益流行,作為其分支的AI配音更成為被重點(diǎn)關(guān)注的行業(yè)。
包括蘋果和谷歌在內(nèi)的科技公司一直致力于AI有聲讀物旁白。2022年,谷歌向包括美國和加拿大在內(nèi)的六個國家的出版商推出了服務(wù)。今年1月,蘋果公司悄然在Apple Books應(yīng)用中上線了一系列由人工智能播講的有聲讀物。蘋果隨后出面澄清,表示上線AI只是服務(wù)于創(chuàng)作者,而不是搶誰的飯碗。有些出版商和專業(yè)配音演員卻并不這樣認(rèn)為,他們覺得蘋果上線AI有聲讀物嚴(yán)重影響了其收入來源,而且蘋果利用他們的聲音樣本來培訓(xùn)AI。
然而,在人們對利用人工智能技術(shù)來生成內(nèi)容的潛力感到興奮之余,許多以創(chuàng)作數(shù)字藝術(shù)為生的人同樣在擔(dān)心他們的未來。AI在有聲領(lǐng)域的出現(xiàn)越加頻繁,人聲配音還有優(yōu)勢嗎?對此,宋琪想了想說:“大概是在作品表達(dá)時,真人往往更能突出作品的‘神韻’吧。AI配音即便能夠表現(xiàn)出基本的情感,但呈現(xiàn)的效果一定不會勝過在作品中傾注了感情和自我理解的人類。”
華西都市報-封面新聞記者 邊雪
責(zé)任編輯:Rex_30