4月20日,出門問問宣布內(nèi)測探索大模型“序列猴子”,并同步開啟了面向創(chuàng)作者的CoPilot產(chǎn)品矩陣,面向C端的升級(jí)版語音助手魔法小問,以及面向B端的企業(yè)專屬大模型的內(nèi)測。
(相關(guān)資料圖)
其中面向創(chuàng)作者的CoPilot產(chǎn)品矩陣包含了四款A(yù)IGC產(chǎn)品,分別為AI寫作平臺(tái)“奇妙文”、AI繪畫平臺(tái)“言之畫”、AI配音平臺(tái)“魔音工坊”、數(shù)字人視頻與直播平臺(tái)“奇妙元”。
出門問問大模型“序列猴子”是一款具備多模態(tài)生成能力的大語言模型,模型以語言為核心的能力體系涵蓋“知識(shí)、對(duì)話、數(shù)學(xué)、邏輯、推理、規(guī)劃”六個(gè)維度,能夠同時(shí)支持文字生成、圖片生成、3D內(nèi)容生成、語音生成和語音識(shí)別等不同任務(wù)。
目前,“序列猴子”大模型已經(jīng)具備了一定的自然語言理解、知識(shí)、邏輯以及推理等能力,對(duì)于“湖南和湖北哪一個(gè)省會(huì)的人口更多?”這類比較復(fù)雜的問題能夠快速給出準(zhǔn)確結(jié)果。
據(jù)介紹,出門問問自研大模型中文名“序列猴子”的靈感,來源于數(shù)學(xué)家埃米爾·波雷爾在20世紀(jì)初提出的“無限猴子”定理。根據(jù)該定理,如果一群猴子隨機(jī)地敲打一臺(tái)打字機(jī),最終一定會(huì)產(chǎn)生完整的莎士比亞作品。這個(gè)定理基于概率論和組合數(shù)學(xué),闡釋了概率的統(tǒng)一性。
出門問問自研大模型的構(gòu)建原理與“無限猴子”類似,海量文本序列通過出門問問自主算法的不斷訓(xùn)練,經(jīng)由大規(guī)模算力消化理解,便練成了“序列猴子”。
出門問問創(chuàng)始人兼CEO李志飛表示,大模型不只是參數(shù)量大,當(dāng)今的大模型是互聯(lián)網(wǎng)文本的深度建模,而互聯(lián)網(wǎng)文本是世界知識(shí)的映射,因此大模型是一個(gè)認(rèn)知模型,是對(duì)語言的建模。而語言是思維的邊界,所以大模型擁有無限想象空間。“序列猴子”在訓(xùn)練過程中已經(jīng)展現(xiàn)出了“涌現(xiàn)”能力,目前正處于“頓悟”階段,未來提升的速度會(huì)越來越快。
他還認(rèn)為,做人類的CoPilot會(huì)是大模型最好的“工作”,未來CoPilot將無處不在。
基于“序列猴子”大模型,出門問問內(nèi)測探索了多款面向創(chuàng)作者的AIGC產(chǎn)品及應(yīng)用,為創(chuàng)作者構(gòu)建一站式CoPilot產(chǎn)品矩陣,打通內(nèi)容創(chuàng)作全流程。
其中,“奇妙文”的AI寫作能力覆蓋了職場辦公、市場營銷、新媒體和創(chuàng)意寫作四大內(nèi)容創(chuàng)作場景,能夠在用戶撰寫年終總結(jié)、客服話術(shù)、劇本、廣告文案等內(nèi)容時(shí),提供靈感和創(chuàng)意方向。
為更好幫助用戶提升內(nèi)容創(chuàng)作效率,“奇妙文”開放了八大AI編輯功能,分別為風(fēng)格轉(zhuǎn)化、要點(diǎn)提取、校對(duì)糾錯(cuò)、續(xù)寫、改寫、擴(kuò)寫、縮寫、翻譯。“奇妙文”還能在寫作中自動(dòng)生成圖片,為用戶帶來圖文并茂的寫作體驗(yàn)。
面對(duì)設(shè)計(jì)師、插畫師等在文字外對(duì)設(shè)計(jì)有強(qiáng)烈需求的創(chuàng)作者,出門問問內(nèi)測探索了“言之畫”AI繪畫平臺(tái)。“言之畫”支持二次元、蒸汽朋克、插畫等8種創(chuàng)作風(fēng)格。用戶只需輸入文字,“言之畫”就能一次性生成8張光影逼真、細(xì)節(jié)豐富的2K高分辨率圖像。
除了以文生圖,“言之畫”還擁有以圖生圖、動(dòng)圖生成、個(gè)性頭像生成等AI繪圖能力,極大豐富了用戶的創(chuàng)作手段。對(duì)于企業(yè)用戶,“言之畫”還支持專屬模型定制,讓企業(yè)用戶能夠根據(jù)自身需要自定義模型風(fēng)格,并且支持多人協(xié)作生產(chǎn),更好地滿足企業(yè)的繪圖需要。
面向AI配音場景,出門問問推出了新一代AI配音產(chǎn)品“魔音工坊”,搭載了大模型AI寫作功能,覆蓋了AI寫作、AI配音和剪輯等多個(gè)場景。用戶可以在它的輔助下輕松完成影視解說、有聲書、在線教育、新聞播報(bào)等集文案與配音于一體的內(nèi)容創(chuàng)作。
目前,“魔音工坊”(海外版DupDub)已向用戶開放了超1000種音色、超2000種聲音風(fēng)格以及超20種方言和外語。
在文字、圖像、聲音等生成能力基礎(chǔ)上,為了讓視頻內(nèi)容創(chuàng)作者更快更好地創(chuàng)作形式新穎、生動(dòng)有趣的作品,出門問問內(nèi)測探索了AI數(shù)字形象創(chuàng)作及直播平臺(tái)“奇妙元”。
據(jù)介紹,“奇妙元”平臺(tái)現(xiàn)有超100款數(shù)字人、超1000款3D數(shù)字資產(chǎn)、超1000種聲音。憑借多模態(tài)生成技術(shù),“奇妙元”平臺(tái)目前共支持圖片建模(2D數(shù)字人)、視頻建模(2.5D數(shù)字人)、3D建模 (3D數(shù)字人)三種不同形式的數(shù)字人生成。
其形象克隆功能,僅需一段5分鐘的真人視頻素材,就可以1:1復(fù)刻用戶的形象神態(tài),為用戶打造聲音一致、動(dòng)作自然的數(shù)字人分身。
公開資料顯示,出門問問對(duì)AI語音的研究可以追溯至十年前,2014年出門問問發(fā)布了首款語音助手“小問助手”,2015年迭代了“小問秘書”,2017年推出了全場景VPA,并在2019年對(duì)VPA進(jìn)行了升級(jí)。
本次發(fā)布會(huì)上出門問問內(nèi)測探索的CoPilot-魔法小問,可以理解為Siri與ChatGPT的綜合體。作為面向個(gè)人用戶開發(fā)一款智能語音助手,“魔法小問”可以幫助用戶查百科信息、查天氣、查餐廳、查酒店,還能與用戶自由對(duì)話,讓用戶更方便、快捷地獲取信息。
據(jù)介紹,“CoPilot”源自超級(jí)助理的概念,它將擁有基于大模型的高智商大腦,能夠分析海量數(shù)據(jù)即時(shí)準(zhǔn)確地與人類交流;還會(huì)擁有動(dòng)聽的聲音、靚麗的形象,可以搭載任意硬件平臺(tái),如手機(jī)、手表、車機(jī)等;還能夠適配千行百業(yè),化身高質(zhì)量教學(xué)的老師、知識(shí)淵博的律師、專業(yè)的醫(yī)生、金融理財(cái)客服等,在需要的時(shí)候,隨時(shí)隨地展示專業(yè)知識(shí),為人分擔(dān)壓力。
基于“序列猴子”大模型的底層能力,對(duì)于B端用戶和垂直領(lǐng)域,“出門問問Copilot”不僅提供通用能力支持服務(wù)和數(shù)字人形象定制服務(wù),還將開放自身角色能力,持續(xù)迭代數(shù)據(jù)接口。有需求的企業(yè)用戶可以登陸web端調(diào)用API服務(wù),并且能通過上傳文檔的方式,對(duì)行業(yè)專有內(nèi)容進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)定制化語音交互。
目前,出門問問已經(jīng)與首批十大行業(yè)的內(nèi)測探索伙伴達(dá)成了合作,包括汽車、教育、律所、金融、醫(yī)療、旅游等,未來出門問問“CoPilot”將逐步賦能更多行業(yè),助力更多企業(yè)擁有自己的專屬大模型,打造自己的專屬“CoPilot”。
責(zé)任編輯:Rex_20