導語
(資料圖)
無論從產品層面還是傳播層面,文心一言的發布都算不上順利。發布會上,李彥宏直言,“文心一言相比于 ChatGPT,還有很高的門檻”;傳播上,選擇播放預錄視頻而非現場演示的百度,遭到了不少對文心一言實際能力質疑。此前,ChatGPT 的令人驚艷的能力引發了人們對它將如何改變未來的熱議。頂著“中國版 ChatGPT”名號出生的文心一言,在這場 AIGC 的競賽中,將扮演什么樣的角色?
一、文心一言的“不完美”
就在文心一言發布的前一天,OpenAI 正式發布了其最新的多模態預訓練大模型 GPT-4。相比于 2020 年推出的 GPT-3,GPT-4 的回答準確性、多模態輸入能力都有著顯著提升。
面對如此強大的競爭對手,在第二天文心一言的發布會上,李彥宏出現了罕見的緊張,李彥宏坦言,“文心一言對標ChatGPT、甚至是對標GPT-4,門檻是很高的。我自己測試感覺還是有很多不完美的地方。”
文心一言和ChatGPT 的差距,從兩者背后的大模型的參數數量就可見一斑。根據百度百科的資料顯示,文心大模型的參數為 2600 億。盡管官方并未公布 GPT-4 的參數數量,但不少信息源表示,GPT-4 的參數數量相比上一代的 1750 億有了大幅提升,達到了 100 萬億的量級。
一般來說,參數數量越多,模型越能夠表示和學習復雜和多樣的知識。雖然大量的參數會讓訓練時間和成本大幅上升,但從現階段來說,模型參數仍是規模越大越好。
此外,基于 GPT-4 的新 ChatGPT 也和文心一言在產品層面上也有著不小的區別。基于GPT-4的新 ChatGPT是一個多模態預訓練模型,能夠處理圖像和文本,以文本的方式進行輸出。而文心一言只能用文本輸入,然后按照指令生成文本、語音、圖像和視頻。
相關從業者表示,與多模態輸入相比,多模態輸出的難度要低一些。比如輸出語音,就是先輸出文字然后再加一個TTS技術,這個技術業內已經比較成熟。而通過文字指令生成圖片以及視頻的相關技術,在百度之前, Meta 和 OpenAI 早有涉足。而 GPT-4 所展現的圖片理解能力,要讓大模型能夠“看見并理解”圖片內容,這就需要在預訓練階段就把圖片和圖片標注信息作為訓練數據,技術難度顯著提升。
二、教育公司們,看中了文心一言的什么?
盡管文心一言相比于業內頂尖水平還有著不小的差距,但文心一言發布前,高途、中公、昂立、千鋒和達內等多家教育公司紛紛宣布與文心一言達成合作。目前,文心一言已經有超過10萬家企業申請測試,并且有650余家企業宣布接入。
百度在發布會上表示,相比于 GPT-4,專注于中文市場的文心大模型在中文領域具備更為出色的自然語言處理能力,在中文語言和中國文化這些領域會有更好的表現。而選擇與文心一言合作的教育公司們,或許正是看中了這一點。
不久前,高途創始人陳向東接受采訪時提到,隨著技術的演進,一些工作相對重復、單調,如簡單回復統一答案、不需要做過多延展的助教老師需求會急劇減少,這部分人工未來很可能會被機器代替。有時機器可能比助教回復得還要好和快,效率也更高,確實有替代風險。
如果文心一言這樣的技術廣泛用于教育場景,就會為不少正在身陷虧損漩渦的教育公司節省巨大的人力成本。此外,李彥宏在發布會中表示,通過百度智能云,文心一言可以幫助企業構建自己的模型和應用。也就是說,文心一言不僅可以充當“助教”,還可以結合教育公司們的實際業務,處理大量的數據和內容,包括教學資料、學生作業和測試結果等。這些數據可以幫助教育公司更好地了解學生的學習情況和需求,并制定更有效的教學策略和課程設計,長期來看,這不僅可以提升教育公司的效率,也可以提升其課程在未來的競爭力。
不過,對于教育公司來說,接入文心一言也存在一定的風險。3 月初,夸克指控高途旗下考途APP非法盜取夸克APP大學題庫引發了人們對于教育內容版權的關注。夸克表示,從去年起,夸克發現考途APP在沒有授權的情況下一直非法竊取夸克大學題庫數據。有媒體對比兩個APP搜題相同題目的結果發現,兩個平臺給出的答案無論是答案內容、答案格式還是解題思路幾乎完全一樣。
盡管文心一言擁有自己的生成內容的能力,但它所生成的內容也大都基于從互聯網上的內容進行學習再輸出。也就是說,在教育場景之下,文心一言所生成的內容,如解體思路、文學賞析等都可能存在一定的版權風險,這也是未來接入教育企業們需要關注的問題。
三、文心一言,還需要更多時間
文心一言發布會當天,百度港股股價下跌6.36%,市值蒸發約300億人民幣。有GPT-4 珠玉在前,資本市場對文心一言的能力顯然沒有那么有信心,而并未現場展現文心一言實際能力的發布會又加劇了資本對于百度的不信任。
但到了第二天,百度港股股價出現反轉,漲幅達到13.67%。隨著文心一言開放測試的進行和企業接入的增加,資本市場開始看到了文心一言的市場潛力。
盡管并未達到行業頂尖水平,但對 AI 長期投入和在中文領域具有先發優勢的百度,是最有可能與 OpenAI 相媲美的中國公司。隨著越來越多的用戶使用文心一言,其進化的速度可能遠比我們想象的要快。百度也在發布會上表示,“一旦有了真實的人類反饋,文心一言的進步速度會非常快,我們都希望它快點成長”。
此外,由于相關政策的限制,百度在中文領域掌握的數據遠比海外的競爭對手更多,其與國內商業公司的合作限制也相對較少,對于剛剛起步的文心一言來說,其未來還有不少的想象空間,文心一言可能會走上與 ChatGPT 完全不同的發展道路,探索出不同的商業模式,現在對文心一言下定論還為時尚早。畢竟,這場 AIGC 的競賽,才剛剛開始。
責任編輯:Rex_25