“ 什么樣的平行宇宙里,才能做到讓一個脫離一線 15 年的人,去懟一個脫離一線 1.5 年的人。”4月14日凌晨,搜狗創(chuàng)始人王小川發(fā)布微博回懟百度副總裁肖陽。
這場互掐源自李彥宏不久前的一句表態(tài),他認為文心一言和ChatGPT的差距可能就在一兩個月。王小川的一句“怎么可能只差兩個月?那一定是在另一個宇宙。”引得百度搜索平臺負責(zé)人肖陽開懟,“王小川脫離一線太久,確實跟百度不在一個宇宙,自然對國內(nèi)人工智能技術(shù)的發(fā)展缺乏了解、當(dāng)年搜狗也立志取代百度搜索,結(jié)果顯而易見。”于是便有了王小川深夜發(fā)微博的一幕。
(相關(guān)資料圖)
在這場口水宇宙里,百度與搜狗的隔空嘴戰(zhàn)火藥味十足,這可能源自他們對AI發(fā)展進度看法不一致,也可能源自他們對產(chǎn)品看法不一致,更可能源于現(xiàn)實世界里AI大模型的硝煙四起。
戰(zhàn)火是從大洋彼岸的ChatGPT開始蔓延,3月16日百度發(fā)布“文心一言”,之后華為、阿里、騰訊、小米、知乎、商湯等十多家公司陸續(xù)發(fā)布或預(yù)告發(fā)布自研大模型,百花斗艷的春日成了互聯(lián)網(wǎng)大廠的AI大模型斗獸場。
相愛相殺的場面在互聯(lián)網(wǎng)圈并不讓人陌生。當(dāng)年一度喧囂不已的“百團大戰(zhàn)”最后也僅剩美團一家獨大。
今天,歷史似乎在重演。ChatGPT橫空出世后,各大公司在大模型賽道上你追我趕,力求在風(fēng)口喝上熱湯。
但這不僅僅是分一杯羹,更像是一場源于危機意識的國際陣地保衛(wèi)戰(zhàn)。
風(fēng)已起,大廠們開始逐浪,但這場數(shù)字模型盛宴終將去往何方?
一把手掛帥掌舵
撥開唇槍舌劍、劍拔弩張的背后,是各大廠一把手緊鑼密鼓的掛帥上陣的架勢。
目前,百度方面由李彥宏親自下場盯研發(fā),一名百度人士對時代周報記者表示,“文心一言發(fā)布會前以天為單位匯報進度,節(jié)奏非常快。目前還是由CTO王海峰牽頭,副總裁吳甜直接負責(zé)大模型。研發(fā)大模型的主力是自然語言處理技術(shù)部門,吳甜則在2010年就進入該部門。”
華為盤古公開負責(zé)人是華為云人工智能領(lǐng)域首席科學(xué)家田奇;阿里方面的大模型研究一直放在阿里云的達摩院,由阿里云智能 CTO、 阿里云首席科學(xué)家周靖負責(zé),阿里CEO張勇兼任阿里云CEO;騰訊混元助手項目則是由騰訊最高級(17 級)研究員、騰訊首席科學(xué)家張正友負責(zé)。
字節(jié)目前尚未發(fā)布自研大模型相關(guān)進度。但一名字節(jié)內(nèi)部人士告訴時代周報記者“我們內(nèi)部有一個娛樂性質(zhì)的接口,不確定是自研發(fā)還是調(diào)用ChatGPT。涉及敏感問題比如內(nèi)部架構(gòu),它都能回答得出來,且答案玄妙,結(jié)合了實際情況和民間流傳版本。”
各大廠一把手掛帥涌向AI,不難看出大廠管理層對大模型的重視。
事實上,這場人工智能取代人類的大風(fēng)蓄力已久,從1950年的圖靈測試到今天,人工智能走了73年。百度、阿里、華為等公司最早在2019年開始研發(fā)自家大模型,如果從人工智能的投入開始計算,百度至少在2010年已經(jīng)布局。
大風(fēng)背后,是更為龐大的應(yīng)用場景和應(yīng)用需求。
4月11日,藍色光標(biāo)剛剛宣布獲得微軟云官方AI調(diào)用和訓(xùn)練許可,相隔一天就有消息傳出。藍色光標(biāo)管理層決定無限期全面停用文案外包。
阿里方面也宣布,未來阿里大模型將會包攬營銷圖案、產(chǎn)品介紹、產(chǎn)品描述等工作。去年已經(jīng)挑選部分商家使用該技術(shù),原本預(yù)計花費數(shù)百萬廣告營銷圖案,可覆蓋40%的工作量。
騰訊混元AI大模型則覆蓋了自然語言處理、計算機視覺、多模態(tài)等基礎(chǔ)模型,且應(yīng)用于騰訊微信搜索、騰訊廣告等自有業(yè)務(wù)場景。總裁劉熾平在年度財報會上曾表示,騰訊業(yè)務(wù)實際上聚焦于社交、通訊和游戲領(lǐng)域,這意味著大模型主要圍繞用戶間的互動,同時要求高質(zhì)量的內(nèi)容。
華為的盤古系列AI大模型包含NLP(自然語言處理)大模型、CV(機器視覺)大模型、科學(xué)計算大模型三大類型。CV大模型可應(yīng)用于工業(yè)鐵路等行業(yè),NLP大模型應(yīng)用于智能文檔搜索等領(lǐng)域;科學(xué)計算大模型可以應(yīng)用于氣象預(yù)報、海浪預(yù)測等領(lǐng)域。其中,盤古CV大模型在鐵路故障檢測系中與傳統(tǒng)檢測方法相比,降低了人工成本,并且在故障樣本檢測中,識別率達到了99%以上。
可謂八仙過海,各顯神通。大廠們看中的可能不僅是AI可以提高工作效率,取代部分比較機械的工作,更重要的是這在未來可以衍生出各種需求。
2008年,央視上映電視劇《魔幻手機》爆火,這部電視劇講述的正式來自2060年傻妞牌智能手機來到2006年結(jié)識陸小千等人,穿越時空,保衛(wèi)地球,情節(jié)科幻,跌宕起伏,令人上頭。
最吸引人的點在于傻妞這款手機可以變成人型,具有人的思考、對話和行為能力,擁有一個手機,就像擁有一位忠實的朋友。簡單來說,她能根據(jù)一切場景結(jié)合人類指令的語義、語氣(語義理解能力),并考慮到人類的情感、實際需求(共情能力、人格模擬能力例如阿里的貓娘人設(shè)),深入理解并給出最合適的回答(基于海量數(shù)據(jù)信息搜索、數(shù)字計算、加工處理并給出解決方案)。即便是最復(fù)雜的中文理解,也能輕松掌握。
誰能拒絕一個能提供“情緒價值與工作價值”的多功能聰明朋友呢?
爆火的科幻驚悚美劇《黑鏡》中也展示了關(guān)于人機交互應(yīng)用的片段,從生活到工作,從交友到戀愛,有無數(shù)的場景與需求中使用大模型中的“數(shù)據(jù)喂養(yǎng)、訓(xùn)練進化”等概念。生活技能、精神陪伴、交友玩樂、戀愛指引,人們有太多的抉擇想要有大數(shù)據(jù)作為參考。
“風(fēng)潮背后是需求。如果只能使用他國產(chǎn)品,就像把大腦放在別的國家懷抱里一樣危險,從模型安全、數(shù)據(jù)安全來說,不能全部開放給GPT,比如意大利直接宣布禁用ChatGPT。如果私密數(shù)據(jù)被吸收,后續(xù)產(chǎn)生飛輪效應(yīng)很難停止。所以國內(nèi)必然要研發(fā)自有平臺。”泰岳梧桐資本合伙人楊揚告訴時代周報記者,“從投資人角度來看,未來超大模型可能不會太多,市場份額中垂類會分類,根據(jù)原有業(yè)務(wù)賽道的優(yōu)勢在細分領(lǐng)域上進行多模塊發(fā)展會是比較合理的方向。”
芯片價格大漲
但想要擁有自研大模型平臺,第一個門檻就是錢。
近日,華創(chuàng)資本合伙人熊偉銘曾對媒體表示:“10億美元的啟動資金,是參與競賽的門票。”據(jù)國盛證券報告估算,GPT-3單次訓(xùn)練成本約為140萬美元,大型語言模型則高至1200萬美元。
假設(shè)燒錢單位不是美元,我們就以10億人民幣為門檻,天眼查上注冊資本10億以上的企業(yè)有多少家呢?可顯示的答案是:8家。
接近百度文心一言業(yè)務(wù)的朱青(化名)告訴時代周報記者,“大模型領(lǐng)域,獨角獸公司和創(chuàng)業(yè)公司的資金沒法做,只能基于開源大模型的基礎(chǔ)上去做。”
原騰訊副總裁,Google資深研究員吳軍也曾公開表示 “ChatGPT不算是一項新技術(shù)革命,中國的大部分研究機構(gòu)是做不了的ChatGPT,不是說研究水平的問題,而是因為ChatGPT太耗資源。”
以阿里為例,阿里曾在財報中披露訓(xùn)練大模型M6時,使用了 512 張英偉達 V100 GPU,V100是 A100 的前序產(chǎn)品,性能大約是A100的三分之一。而A100在4月16日京東上公開售價約為11萬元一張,這意味著單次訓(xùn)練成本高達數(shù)千萬元。
但一只腳邁入門內(nèi)的大廠,即使有資金作為底氣,硬件上也可能存在障礙。在國內(nèi),云計算技術(shù)人士有一個說法是,做好AI大模型的算力最低門檻是1萬枚英偉達A100芯片。
2022年三季度,英偉達針對中國需求根據(jù)A100芯片推出降維版本A800,但傳輸速率大于600GB/s的限制改為了400GB/S。換句話說,處理信息的效率降低而耗電量增加。
AI大模型狂飆的同時,芯片的價格也水漲船高。據(jù)媒體報道,3月27日,京東上A800最高售價為93999元。但4月15日,時代周報記者在京東上查看A800,發(fā)現(xiàn)最高售價已漲至99799元(原價99999),短短半個月漲價5800元,漲幅6.17%。A800背后的芯片廠商英偉達(Nvidia)更是在三個月內(nèi)股價漲幅近200%。
要知道,2023年以來,比特幣自1.6萬美元升至2.3萬美元,整體漲幅也不過接近40%。
事實上,GPU芯片的重要性來自于它對算力的作用。算力簡單來說就是處理信息,實現(xiàn)目標(biāo)結(jié)果輸出的計算能力,AI大模型的升級訓(xùn)練往往需要幾千億級的數(shù)據(jù)量作為支撐,GPU作為信息處理器,就像支撐心臟跳動的大動脈,保持高效暢通才能實現(xiàn)心臟良好運轉(zhuǎn)。
實際上,各大廠也有先手陸續(xù)研發(fā)自己的芯片。百度在2020年就開始部署昆侖芯片、騰訊同樣在2020年成立星星海實驗室研究硬件工程,華為的麒麟芯片則在2008年開始研發(fā),只是無論哪家,性能上仍無法完全與A100對齊。
4月14日,騰訊也發(fā)布混元大模型背后的訓(xùn)練框架AngelPTM,按騰訊的說法,用于AI推理的自研芯片紫霄已經(jīng)完成量產(chǎn),能夠提供高達3倍的計算加速性能,以及超過45%的整體成本節(jié)省。
但當(dāng)下的情況始終是自研不足,儲備有限,朱青表示:“產(chǎn)業(yè)界都在研究這個問題,但無解。只能盡快發(fā)展芯片制造的全產(chǎn)業(yè)鏈。對此情形,可考慮租用算力,比如百度、華為都曾與鵬城實驗室合作訓(xùn)練大模型。”
因此,一旦踏入大模型的賽場,比起內(nèi)部比拼GPU儲備量,更重要的還是將目光放長遠。各大公司原有的數(shù)據(jù)參數(shù)將會是訓(xùn)練大模型進一步優(yōu)化的關(guān)鍵,結(jié)合產(chǎn)業(yè)會是更好的選擇。
秉燭夜行,去往何方?
細分領(lǐng)域的發(fā)展已然在摸索當(dāng)中了。
當(dāng)代社會,伴隨越來越繁忙的工作節(jié)奏,人們無暇社交,情感需求也將成為細分領(lǐng)域的需求大類。百度文心一言的首批生態(tài)合作伙伴中,年輕人語音虛擬社交平臺Soul也赫然在列。
不久前B站上引爆全網(wǎng)的阿里通義測評視頻中,貓娘人設(shè)的對話體驗對于喜歡二次元的用戶來說有極強殺傷力,有網(wǎng)友評論到“會喵它就已經(jīng)贏了”。足見社交平臺上語音人設(shè)的吸引力。
華為則以“推動人工智能開發(fā)從“作坊式”到“工業(yè)化”升級為目標(biāo),力求形成關(guān)鍵技術(shù)壁壘,為煤礦、水逆、電力、金融、農(nóng)業(yè)、國家云創(chuàng)造產(chǎn)業(yè)價值。
阿里的大招則是“所有軟件都值得接入大模型升級改造”,更長遠的計劃是幫助每家企業(yè)打造自己的專屬大模型。
眼下加入AI大模型的公司,在摸石頭過河的同時也在積極探尋護城河產(chǎn)品,但對比ChatGPT,各大廠原本的優(yōu)勢賽道經(jīng)驗并無明顯加持效果。
黑夜中秉燭,摸索而行,路線很多,但沒有一個人知道,如何可以走到羅馬。
巨頭崛起之路上,被迫防守還是主動殺出門去,很難自主答題。時間和時機,隨時都在變化。
按OpenAI CEO 、“ChatGPT之父”Sam Altman的說法,全球AI運算量每隔18個月就會提升一倍。在科技日新月異的時代,任何入局的公司都需要認真對待隨時變化的戰(zhàn)局,這可能是AI時代的新“摩爾定律”。
4月14日,亞馬遜云科技(AWS)推出了自己的生成式AI服務(wù)Bedrock,正式加入AI賽道。未來的路肯定是越來越擁擠,留給大廠們的打嘴戰(zhàn)的時間也不會太多了。
正如上海市人工智能行業(yè)協(xié)會秘書長鐘俊浩所說的,“OpenAI起步早、積累久、投入大,國內(nèi)GPT在核心能力和全面性方面都存在較大差距,特別是推理能力、問題理解能力、文本生成能力、系統(tǒng)工程能力等方面,這種核心能力的差距,我們還需要一段時間來追趕。”
從技術(shù)追趕到規(guī)范管理,每一步都有很長的路要走。
我們都知道這是一場漫長的戰(zhàn)斗,打嘴炮并不會獲得最后真正的勝利。
(文中朱青為化名)
責(zé)任編輯:Rex_17