AI配音情緒節奏全有 配音員會被取代嗎?
(資料圖片)
人工智能是挑戰,但更多的是新機會。圖據CFP
肚子餓到咕咕叫,周圍突然產生噪音,這大概是音頻主播不在專業錄音室,卻需要工作時最怕發生的事情。日前,從事配音工作十余年的宋琪(化名)告訴華西都市報、封面新聞記者:“如果麥克風質量尚佳且收聲不錯,這些雜音就會被一同收錄進配音作品中,這時配音相當于白費功夫。”
然而,周遭或人為產生的任何噪音都不會影響到AI配音。
配音員會被AI取代嗎?
不久前,“科大訊飛”在其視頻號發布了語音技術AI合成聲配音的短片《雨水》,這也被稱為AI合成聲繼微軟云希、曉曉聲音之后,在諸多細節上的突破。
而這段人工智能制作的《雨水》,再次引發了人們關于配音專業的危機論。進入人工智能時代,AI已在悄然改變我們的生活,配音行業自然也難以幸免。“不知道五年后,我還能不能從事這份工作。”宋琪說,資深配音員會在配音中追求聲音的特質,但因為受限于畫面和文案,很難完全表達自己的個性,容易形成聲音符號化,表達形式呈現過于理性的固化特性,而學習功能強大的AI恰恰可以利用大數據分析輸入樣板輕松模仿完成。
“如果一個角色情緒起伏比較大,比如主人公在父親去世后哭泣,那我必須在配音中傳達出那些情緒,但這種情緒是需要醞釀的,如果今天我的狀態不佳,那么配出來的音就會不真實。”宋琪表示,幾年前人工智能的配音還比較生硬,自己也從未考慮過AI會威脅到職業生涯。“但這兩年,通過相關技術的升級,通過不斷學習不同情緒的聲音來優化的AI配音作品,情緒到位,配音過程迅速又便捷,確實讓我有種職業發展的焦慮。”
為何選擇AI配音?
在表現形式單一的配音領域,由于可以較好地模擬真人的聲音,AI逐漸展露出在配音方面極高的商業價值。
據外媒報道,密歇根大學出版社的有聲讀物,每年出版大約100本學術書籍——由學校為學者或學生出版。然而,為一本可能只賺幾百美元的書聘請一名解說員的費用可能高達6000美元,更不用說密集的生產過程了。根據ACX(亞馬遜的有聲讀物創作交易所)的說法,一小時的有聲讀物,人工制作需要大約六個小時。
對于規模較小的作者和出版商而言,制作有聲讀物的時間和成本可能無法承受,而AI配音可以改變這一點。
復制或克隆一個人的聲音,最常用到的一項技術叫Deepfake Voice,也稱語音克隆或合成語音,其目的是使用AI生成一個人的語音。但簡單來說,合成語音就是計算機生成的語音,也叫語音合成,一般是通過人工智能(AI)和深度學習來實現的。
目前,Deepfake Voice這項技術已經發展到可以在音調和相似度上非常準確地復制人聲的地步,一些頭部互聯網企業在AI調音方面也已經能做到很高相似程度的聲線模仿。并且,隨著最新AI技術的引入,只使用一些目標聲音的特征,比如語音波形,也可以進行更深入的分析和提取。
因此根據AI配音發展的現狀來看,它已經能為很多需要配音的工作解決不少麻煩,比如配音演員的選擇,各種影視劇和游戲里不同的角色需要不同特征的聲線,而AI配音技術就能滿足這一需求,一些配音軟件僅需5秒就轉換出作品所需要的聲線和配音內容。
當AI入局配音市場之后
有聲讀物市場火爆,也讓科技公司爭先恐后地進行行業布局。據公開數據顯示,2022年有聲讀物產品在歐美銷售額猛增25%,收入超過15億美元。
根據相關機構報告預測,到2030年,有聲讀物市場預計將達到335億美元,高于2021年的約42億美元。伴隨播客在全球的日益流行,作為其分支的AI配音更成為被重點關注的行業。
包括蘋果和谷歌在內的科技公司一直致力于AI有聲讀物旁白。2022年,谷歌向包括美國和加拿大在內的六個國家的出版商推出了服務。今年1月,蘋果公司悄然在Apple Books應用中上線了一系列由人工智能播講的有聲讀物。蘋果隨后出面澄清,表示上線AI只是服務于創作者,而不是搶誰的飯碗。有些出版商和專業配音演員卻并不這樣認為,他們覺得蘋果上線AI有聲讀物嚴重影響了其收入來源,而且蘋果利用他們的聲音樣本來培訓AI。
然而,在人們對利用人工智能技術來生成內容的潛力感到興奮之余,許多以創作數字藝術為生的人同樣在擔心他們的未來。AI在有聲領域的出現越加頻繁,人聲配音還有優勢嗎?對此,宋琪想了想說:“大概是在作品表達時,真人往往更能突出作品的‘神韻’吧。AI配音即便能夠表現出基本的情感,但呈現的效果一定不會勝過在作品中傾注了感情和自我理解的人類。”
華西都市報-封面新聞記者 邊雪
責任編輯:Rex_30