近年來(lái),得益于人工智能技術(shù)的突破,以虛擬主播、虛擬偶像等為代表的“虛擬數(shù)字人”進(jìn)入大眾視野。近日,百度發(fā)布國(guó)內(nèi)首個(gè)可在APP內(nèi)互動(dòng)的超寫(xiě)實(shí)數(shù)字人,并將其融入百度APP語(yǔ)音搜索功能,用戶可在語(yǔ)音搜索時(shí)與其進(jìn)行面對(duì)面的實(shí)時(shí)對(duì)話。“生活智能伙伴”成為數(shù)字人發(fā)展新方向。
今年以來(lái),虛擬數(shù)字人市場(chǎng)快速升溫,多家科技企業(yè)發(fā)布了數(shù)字人相關(guān)產(chǎn)品。阿里巴巴開(kāi)發(fā)的超寫(xiě)實(shí)數(shù)字人AYAYI已經(jīng)正式“入職”阿里,成為天貓超級(jí)品牌日的數(shù)字主理人;OPPO發(fā)布的基于虛擬人多模態(tài)交互的手機(jī)智能助手“小布虛擬人”,可實(shí)現(xiàn)與用戶在多個(gè)場(chǎng)景生態(tài)下的實(shí)時(shí)交互;B站則專門(mén)為虛擬主播開(kāi)設(shè)分區(qū)。
據(jù)介紹,百度推出的超寫(xiě)實(shí)數(shù)字人聚焦于實(shí)用功能,可滿足用戶在多場(chǎng)景下的搜索需求,例如用戶說(shuō)出“今天天氣怎樣”,數(shù)字人即可快速識(shí)別并自動(dòng)語(yǔ)音播報(bào)第一條搜索結(jié)果。除了對(duì)搜索結(jié)果進(jìn)行播報(bào)外,還可對(duì)端功能進(jìn)行控制,實(shí)現(xiàn)夜間模式、書(shū)架、游戲等功能的一語(yǔ)直達(dá)。相關(guān)負(fù)責(zé)人表示,百度仍在持續(xù)探索如何讓數(shù)字人更智能化,未來(lái)將開(kāi)發(fā)數(shù)字人實(shí)時(shí)聊天、設(shè)置到手機(jī)桌面等功能;并計(jì)劃建造數(shù)字人開(kāi)放平臺(tái),基于更豐富場(chǎng)景拓展更多數(shù)字人IP類型,提供定制個(gè)性形象。
虛擬數(shù)字人的背后,集成了多模態(tài)建模、語(yǔ)音識(shí)別、自然語(yǔ)言處理、知識(shí)圖譜、視覺(jué)技術(shù)等綜合AI能力,其在社交、傳播、營(yíng)銷(xiāo)等領(lǐng)域的價(jià)值正在逐漸顯現(xiàn)。隨著相關(guān)技術(shù)逐漸成熟,數(shù)字人作為與虛擬世界的重要交互載體,潛在市場(chǎng)廣闊。對(duì)于用戶而言,虛擬人是進(jìn)入虛擬世界的必要化身,用戶可以根據(jù)喜好設(shè)置多個(gè)形象迥異的分身;對(duì)于經(jīng)紀(jì)公司而言,虛擬偶像比真人違約風(fēng)險(xiǎn)低,因此其有意愿孵化虛擬偶像和虛擬主播;對(duì)于商家而言,多樣化數(shù)字人的上線也能獲得更多商業(yè)化場(chǎng)景,拓展新的數(shù)字營(yíng)銷(xiāo)空間。
行業(yè)智庫(kù)量子位發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》顯示,到2030年,我國(guó)虛擬數(shù)字人整體市場(chǎng)規(guī)模將達(dá)到2700億元,其中,身份型虛擬數(shù)字人約1750億元,服務(wù)型虛擬數(shù)字人總規(guī)模超過(guò)950億元。
盡管概念火熱,但目前虛擬數(shù)字人產(chǎn)業(yè)仍處于較為初期的階段,發(fā)展還面臨政策、資本、技術(shù)、人才等層面的限制。例如,在技術(shù)方面,虛擬數(shù)字人的制作方式自動(dòng)化程度低、生產(chǎn)門(mén)檻高,關(guān)鍵技術(shù)還不完全成熟。在應(yīng)用方面,目前市場(chǎng)正處于前期培育階段,替代真人服務(wù)的虛擬主播和虛擬IP中的虛擬偶像是目前的市場(chǎng)熱點(diǎn),應(yīng)用偏向于娛樂(lè)化,生活服務(wù)類數(shù)字人應(yīng)用較少。此外,在體系標(biāo)準(zhǔn)和安全倫理方面,行業(yè)內(nèi)還需要統(tǒng)一的技術(shù)標(biāo)準(zhǔn)和要求,相關(guān)法律法規(guī)、倫理規(guī)范也尚待完善。
與真實(shí)世界的人一樣,虛擬數(shù)字人前行也需腳踏實(shí)地。中國(guó)社科院信息化研究中心主任、研究員姜奇平認(rèn)為,數(shù)字人行業(yè)未來(lái)的發(fā)展還是掌握在擁有技術(shù)的企業(yè)手中。比如百度APP最新上線的數(shù)字人,使用了AI語(yǔ)音識(shí)別、4D掃描、TTS等多項(xiàng)技術(shù)去解決用戶的生活問(wèn)題。AI技術(shù)的不斷成熟,也將為數(shù)字人創(chuàng)造更多元的應(yīng)用場(chǎng)景,和更大的未來(lái)發(fā)展空間。“當(dāng)然,這些技術(shù)最終還是要以人為本。”姜奇平表示。記者 王軼辰
責(zé)任編輯:Rex_08