(文/呂棟 賀喜格)
在OpenAI推出GPT-4一天后,百度官宣已久的類ChatGPT產品“文心一言”也終于公開露面,并且和GPT-4一樣也是多模態。
北京時間3月16日下午,百度召開發布會,主題圍繞新一代大語言模型、生成式AI產品“文心一言”。
(資料圖片僅供參考)
觀察者網在現場看到,百度首席執行官李彥宏和百度首席技術官王海峰均出席了發布會,并在現場展示了“文心一言”在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。
令市場感到有些許失落的是,百度并未在現場直接調用“文心一言”,而是采用提前錄好的視頻進行展示。亮相了,但又沒有完全亮相。這種情況可能也在一定程度上影響了百度股價,導致其盤中出現短線下挫。
從現場展示來看,文心一言某種程度上具有了對人類意圖的理解能力。但李彥宏也多次提及,這類大語言模型還遠未到發展完善的階段,進步空間很大,未來這段時間它一定會飛速發展。
觀察者網從現場了解到,此次“文心一言”公開亮相后,并不會直接面向公眾推出,而是先采用邀請測試方案。從3月16日起,首批用戶可通過邀請測試碼,在“文心一言”官網體驗產品,后續才會陸續開放給更多用戶。這可能也間接證實,“文心一言”目前尚未成熟。
那么,百度為何甘冒風險,略顯倉促地推出“文心一言”呢?這一方面可能是為了搶得對標ChatGPT的頭籌,獲得更多用戶以訓練大語言模型,另一方面則可能考慮到內外部的需求。
李彥宏在現場表示:“在全球的大廠中,百度是第一個做出對標ChatGPT的產品的企業。雖然‘文心一言’的內測體驗不能稱作完美,但為什么現在發布呢?是因為百度的各個產品現都在等著這樣的產品,我們的客戶和合作伙伴也在等著這樣的技術。”
在此次發布會之前,有外媒援引知情人士稱,為了開發“文心一言”,數百名百度員工一直在夜以繼日地工作。甚至在正式發布前夕,“文心一言”基于的AI模型仍在接受數據訓練。一些員工坦言,他們沒有足夠的時間來打造一款功能完善的產品。
根據百度方面的披露,“文心一言”大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
那這次通過視頻亮相的“文心一言”表現如何呢?在現場,李彥宏展示了“文心一言”在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。
以文學創作場景為例,“文心一言”根據對話問題將《三體》的核心內容進行了總結,并提出了五個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。商業文案創作場景中,文心一言順利完成了給公司起名、寫Slogan、寫新聞稿的創作任務。
在數理推算場景中,“文心一言”能夠學會數學推演及邏輯推理等相對復雜任務。面對“雞兔同籠”這類鍛煉人類邏輯思維的經典題,文心一言能理解題意,并有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。
作為扎根于中國市場的大語言模型,文心一言在中文語言和中國文化上,相比國外的大模型產品無疑會有更好的表現。在現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。
昨日(3月15日),OpenAI發布多模態模型GPT-4,可接收圖像和文本輸入來輸出文本內容,受到外界關注,而文心一言本次發布的版本同樣具備多模態功能,支持文本、圖片、音頻、視頻生成。
在更體現技術能力的多模態生成方面,李彥宏現場展示了“文心一言”生成文本、圖片、音頻和視頻的能力。有趣的是,“文心一言”甚至能夠生成四川話等方言語音;“文心一言”的視頻生成能力則因成本較高,現階段還未對所有用戶開放,未來會逐步接入。
從“文心一言”的表現看,某種程度上它具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性都逐漸接近人類水平。但整體而言,這類大語言模型還遠未到發展完善的階段,有賴于通過真實的用戶反饋而逐步迭代。
王海峰表示,文心一言,是新一代知識增強大語言模型,是在ERNIE及PLATO系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。
前三項是這類大語言模型都會采用的技術,ERNIE和PLATO中也已經有應用和積累,在文心一言中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新。
多年來,百度大語言模型上投入積極,有市場數據顯示,百度研發的50%-60%的投入都給到了Ernie。
近日有外媒援引知情人士稱,隨著ChatGPT熱度上升,今年1月初,百度高管讓其自然語言處理團隊開始用文心大模型整合出一款對標ChatGPT的產品。但前述知情人士表示,與其他從事類ChatGPT技術的AI開發者所遇到的情況一樣,這一項目面臨一些挑戰。
其中一個挑戰是,需要訓練該模型對有多種釋義的短語或可指代多人的名字進行辨別,從而能對用戶的要求做出更精確的反應。另一個挑戰是使該聊天機器人生成的語言看起來更像人類說的話。第三個挑戰是提高事實準確性,這是大語言模型的一個技術限制;大語言模型會根據不同詞語可能出現在一起的概率將句子串起來,而不是根據信息片段。這種限制也使得這種模型難以控制以避免敏感話題。
“文心一言”的真實水平如何,還有待觀察百度后續推出的公測版本。據百度披露,自2月份該公司官宣“文心一言”以來,已有超過650家企業宣布接入文心一言生態。
有市場觀點指出,百度之所以沒有迅速開放公測,一方面是因為產品尚未成熟,另一方面可能也是出于成本和收入考慮。之前有估算稱,ChatGPT每天成本消耗有超過10萬美元。來自摩根士丹利的分析師估計,ChatGPT每次查詢的成本大約是谷歌傳統搜索查詢成本的七倍。
在本次發布會上,李彥宏表示:“無論哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年堅持和積累,沒法速成。”他同時提到,如果建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪,“文心一言”效果會迅速提升。
責任編輯:Rex_16