【文/觀察者網(wǎng)專欄作者 劉典】
2023年無(wú)疑是生成式人工智能的關(guān)鍵一年,就在這個(gè)4月,一場(chǎng)大模型風(fēng)暴已經(jīng)來(lái)臨:
4月8-9日,華為盤(pán)古大模型發(fā)布會(huì);4月10日,商湯大模型發(fā)布會(huì);4月11日,阿里大模型發(fā)布會(huì);4月14日,同花順AI產(chǎn)品發(fā)布會(huì);4月18日,阿里行業(yè)類模型發(fā)布會(huì)……
(相關(guān)資料圖)
生成式人工智能進(jìn)步的速度令人瞠目結(jié)舌。僅僅在ChatGPT發(fā)布幾個(gè)月后,新的人工智能就已經(jīng)再次進(jìn)化出重大升級(jí)——GPT-4擁有了多模態(tài)的能力,不僅能看懂文字,也能看懂圖片了。與此同時(shí),微軟將ChatGPT整合到必應(yīng)搜索中,同時(shí)將GPT-4融入微軟365,旨在打破辦公套件的行業(yè)格局。
沒(méi)幾天,OpenAI首席執(zhí)行官山姆·阿爾特曼在Twitter上宣布了一條消息:我們正在推出ChatGPT插件,您可以通過(guò)安裝插件來(lái)有效地完成各種任務(wù)。我們非常期待看到開(kāi)發(fā)人員創(chuàng)造出來(lái)的新東西!
一時(shí)間,數(shù)百億、千億乃至萬(wàn)億級(jí)參數(shù)規(guī)模的人工智能大模型相繼涌現(xiàn),這場(chǎng)ChatGPT引發(fā)的全球大模型競(jìng)爭(zhēng)趨于日趨激烈,這也意味著其背后的人工智能大模型開(kāi)始進(jìn)入市場(chǎng)激烈爭(zhēng)奪和技術(shù)快速迭代的關(guān)鍵博弈期。而這場(chǎng)大模型的競(jìng)爭(zhēng)很可能像九十年代PC操作系統(tǒng)的競(jìng)爭(zhēng)一樣,具有“壟斷性”的傾向和趨勢(shì),一旦輸?shù)舾?jìng)爭(zhēng),就可能會(huì)失掉整個(gè)市場(chǎng)。
GPT-4擁有了多模態(tài)的能力,不僅能看懂文字,也能看懂圖片了
大模型進(jìn)入博弈期
GPT-4的發(fā)布在各個(gè)領(lǐng)域引起了巨大的轟動(dòng),因?yàn)樗谌斯ぶ悄芗夹g(shù)中達(dá)到了一個(gè)新的高度。在某些領(lǐng)域,GPT-4已經(jīng)顯露出了其絕對(duì)優(yōu)勢(shì),或者說(shuō)“AI霸權(quán)”。
這里說(shuō)的“霸權(quán)”不是政治學(xué)里面的操縱或控制其他國(guó)家的地位,類似于之前為人所知的“量子霸權(quán)”的說(shuō)法,即在某一領(lǐng)域產(chǎn)生原有工具遠(yuǎn)不能及的技術(shù)優(yōu)勢(shì)。比如應(yīng)用了GPT-4的Office辦公軟件,只要人們動(dòng)動(dòng)嘴(輸入想要的期待),從Word到Excel再到PPT,普通人工可能需要一天完成的工作,人工智能幾乎就是一瞬間的事情。更不用提ChatGPT在編程領(lǐng)域及基礎(chǔ)文案工作上已經(jīng)逐步產(chǎn)生可觀的生產(chǎn)力了。這將大大降低所謂的“工程師紅利”,而未來(lái)通過(guò)創(chuàng)新產(chǎn)生的競(jìng)爭(zhēng)力比重將繼續(xù)增大,節(jié)約下來(lái)的人工可以解放出更多的創(chuàng)新生產(chǎn)力。能否盡快實(shí)現(xiàn)“AI霸權(quán)”,會(huì)成為未來(lái)實(shí)現(xiàn)創(chuàng)新性國(guó)家的一塊重要基石。
GPT-4以及眾多生成式人工智能的背后,是人工智能大模型的訓(xùn)練結(jié)果。隨著如ChatGPT和文心一言逐漸進(jìn)入應(yīng)用和商業(yè)層面,背后的各個(gè)大模型也進(jìn)入關(guān)鍵博弈期。中國(guó)能否在未來(lái)數(shù)年內(nèi)推出自己的大模型成為關(guān)鍵。
從參數(shù)規(guī)模來(lái)看,國(guó)內(nèi)已經(jīng)誕生了能夠比肩ChatGPT參數(shù)量的大模型。有與美國(guó)一拼高下的基礎(chǔ)和潛力。而大模型競(jìng)爭(zhēng)之所以時(shí)間緊迫,有這么幾個(gè)考慮。
大模型競(jìng)爭(zhēng)同時(shí)也是一場(chǎng)市場(chǎng)爭(zhēng)奪戰(zhàn)。先占領(lǐng)市場(chǎng)、研發(fā)排他性強(qiáng)獨(dú)占性強(qiáng)的優(yōu)勢(shì)產(chǎn)品,既是大廠企業(yè)的競(jìng)爭(zhēng)策略,也是優(yōu)勢(shì)廠家的競(jìng)爭(zhēng)結(jié)果。目前,谷歌推出類似ChatGPT的大模型Bard之后,谷歌與微軟的競(jìng)爭(zhēng)再起:微軟正聚焦在B端(如辦公軟件、云計(jì)算和人工智能相關(guān)產(chǎn)品)以及游戲等相關(guān)領(lǐng)域,而谷歌則在C端市場(chǎng)、互聯(lián)網(wǎng)領(lǐng)域推出更多定制化產(chǎn)品。而不管是B端還是C端,對(duì)這些優(yōu)勢(shì)產(chǎn)品必然有依賴性,這樣的依賴性也將是這些產(chǎn)品繼續(xù)在所處賽道擴(kuò)大優(yōu)勢(shì)的重要方式。
對(duì)于那些獲得大模型先手優(yōu)勢(shì)的企業(yè)來(lái)說(shuō),在這輪競(jìng)爭(zhēng)中更容易積累“數(shù)據(jù)雪球”、建立“數(shù)據(jù)壁壘”。在自然語(yǔ)言處理領(lǐng)域,數(shù)據(jù)是訓(xùn)練大型語(yǔ)言模型的基礎(chǔ),因此擁有高質(zhì)量的數(shù)據(jù)集是非常重要的。以ChatGPT為例,在ChatGPT的發(fā)展過(guò)程中,通過(guò)搶先開(kāi)始公測(cè)并收集用戶數(shù)據(jù),OpenAI獲得了巨大的先發(fā)優(yōu)勢(shì)。這些數(shù)據(jù)不僅有助于優(yōu)化ChatGPT的性能和提升用戶體驗(yàn),還可以用于訓(xùn)練更加先進(jìn)的大型語(yǔ)言模型,從而擴(kuò)大數(shù)據(jù)優(yōu)勢(shì)。而這部分寶貴的數(shù)據(jù)被微軟獨(dú)家占有。
為了持續(xù)維護(hù)數(shù)據(jù)壁壘,OpenAI需要不斷地投入資金和人力資源進(jìn)行數(shù)據(jù)采集、標(biāo)注和更新,同時(shí)不斷改進(jìn)模型算法和優(yōu)化性能,以確保ChatGPT始終是最好用的自然語(yǔ)言處理類大模型,而只要ChatGPT仍然是最好用的自然語(yǔ)言處理類大模型,這個(gè)“雪球”就會(huì)越滾越大,其他企業(yè)將越來(lái)越難追上,從而進(jìn)一步擴(kuò)大“雪球”效應(yīng),鞏固其在市場(chǎng)上的領(lǐng)先地位。
此外,擁有市場(chǎng)和壁壘的企業(yè)將進(jìn)一步對(duì)國(guó)際標(biāo)準(zhǔn)制定發(fā)起進(jìn)攻。人工智能大模型的國(guó)際標(biāo)準(zhǔn)領(lǐng)域,包括模型的設(shè)計(jì)和開(kāi)發(fā)標(biāo)準(zhǔn)、模型的應(yīng)用和部署標(biāo)準(zhǔn)、模型的數(shù)據(jù)隱私和安全標(biāo)準(zhǔn)、模型的倫理和社會(huì)責(zé)任標(biāo)準(zhǔn)、模型的性能和效果評(píng)價(jià)標(biāo)準(zhǔn)等等。在某一市場(chǎng)和領(lǐng)域,通過(guò)制定國(guó)際標(biāo)準(zhǔn),企業(yè)可以獲得更廣泛的認(rèn)可和市場(chǎng)份額。特別是對(duì)一些排他性的技術(shù)、軟件和產(chǎn)品,一旦國(guó)際標(biāo)準(zhǔn)被確定下來(lái),制定標(biāo)準(zhǔn)者將能夠決定市場(chǎng)走向。
就拿模型的數(shù)據(jù)隱私和安全標(biāo)準(zhǔn)來(lái)說(shuō),包括模型在數(shù)據(jù)收集、存儲(chǔ)、傳輸、使用等方面的隱私和安全標(biāo)準(zhǔn),目的是確保模型對(duì)用戶數(shù)據(jù)的隱私和安全有一定的保障,避免出現(xiàn)數(shù)據(jù)泄露和濫用等問(wèn)題。而一旦一些大模型擁有了這方面的標(biāo)準(zhǔn)制定權(quán)或優(yōu)勢(shì),將更易于將自己的大模型推廣出去,成為具有壟斷性的產(chǎn)品。
除此之外,如果大模型與應(yīng)用端的廠家也向國(guó)際標(biāo)準(zhǔn)制定發(fā)起進(jìn)攻,很有可能以后一些軟件和產(chǎn)品也會(huì)出現(xiàn)獨(dú)特的標(biāo)準(zhǔn),就像當(dāng)年微軟的office標(biāo)準(zhǔn)OOXML一樣。一旦這樣的標(biāo)準(zhǔn)出現(xiàn)了,其他大模型連接的產(chǎn)品無(wú)法接入,勢(shì)必就會(huì)逐漸敗落。
因此未來(lái)幾年大模型進(jìn)入關(guān)鍵博弈期,它的市場(chǎng)競(jìng)爭(zhēng)或許可以參考操作當(dāng)年微軟和蘋(píng)果、中國(guó)與微軟系統(tǒng)競(jìng)爭(zhēng)的經(jīng)驗(yàn)和教訓(xùn)。
從操作系統(tǒng)之爭(zhēng)看大模型之戰(zhàn)
之所以說(shuō)大模型的競(jìng)爭(zhēng)很可能像九十年代PC操作系統(tǒng)的競(jìng)爭(zhēng)一樣,具有“壟斷性”的傾向和趨勢(shì),其本質(zhì)還是在于大模型和操作系統(tǒng)一樣,都是一個(gè)技術(shù)新時(shí)代的“基礎(chǔ)設(shè)施”。如同需要搭乘操作系統(tǒng)的軟件一樣,所有的人工智能產(chǎn)品,尤其是生成式人工智能,乃至未來(lái)可能的通用型人工智能,都需要依靠背后的人工智能大模型才能完成訓(xùn)練、輸出等一系列動(dòng)作。
2020年中國(guó)計(jì)算機(jī)操作系統(tǒng)市場(chǎng)份額占比圖
而這樣的大模型,與操作系統(tǒng)一樣具有壟斷性的特點(diǎn)。一方面,不管是大模型還是操作系統(tǒng),它們的競(jìng)爭(zhēng)都是不同生態(tài)之間的競(jìng)爭(zhēng)。正如中科院院士倪光南所說(shuō),操作系統(tǒng)的成功與否,關(guān)鍵在于生態(tài)系統(tǒng),需要能夠搭建起完整的軟件開(kāi)發(fā)者、芯片企業(yè)、終端企業(yè)、運(yùn)營(yíng)商等產(chǎn)業(yè)鏈上的各個(gè)主體。大模型也是同樣的道理,一個(gè)優(yōu)秀的大模型也將會(huì)建立起一套排他性強(qiáng)、獨(dú)占性強(qiáng)的生態(tài)系統(tǒng)。
另一方面,一旦某一個(gè)大模型或操作系統(tǒng)占領(lǐng)了市場(chǎng),它將獲得相對(duì)于其他后來(lái)者無(wú)可比擬的優(yōu)勢(shì)。這既是由于人們對(duì)于生態(tài)系統(tǒng)產(chǎn)生路徑依賴,也是源于大模型的數(shù)據(jù)特點(diǎn),優(yōu)秀的大模型將能吸引到更多數(shù)據(jù),滾起“數(shù)據(jù)雪球”。而這樣的大模型,也將成為人們唯一選擇和依賴的大模型,最終形成對(duì)于大模型的依賴,后來(lái)者很難再通過(guò)同樣的路徑對(duì)其進(jìn)行趕超。
大模型的出現(xiàn)、爭(zhēng)奪過(guò)程、以及失利之后的慘痛后果,或許都可以從九十年代到二十一世紀(jì)初的操作系統(tǒng)之爭(zhēng)中找到。
首先,先發(fā)者不一定制人,但爭(zhēng)霸即是巔峰。而如操作系統(tǒng)的稱霸之于軟件的壓倒性作用一樣,大模型的爭(zhēng)霸,很有可能導(dǎo)致整個(gè)應(yīng)用端的生態(tài)變成“零合競(jìng)爭(zhēng)”的戰(zhàn)場(chǎng)。與大模型的出現(xiàn)一樣,當(dāng)年微軟的Windows3和蘋(píng)果的Macintosh,是兩個(gè)劃時(shí)代的同類產(chǎn)品之間的競(jìng)爭(zhēng)。
1984年,蘋(píng)果的Macintosh正式發(fā)布,這是第一款圖形化操作系統(tǒng)。但在當(dāng)時(shí),Macintosh由于兼容性太差,售價(jià)過(guò)高,市場(chǎng)反響平平。1990年,微軟也推出了自己的圖形化操作系統(tǒng)——Windows 3。憑借此前積累的眾多用戶,該系統(tǒng)一經(jīng)推出,就得到了迅速推廣,占領(lǐng)了Macintosh的市場(chǎng)。
微軟靠Windows3贏得了操作系統(tǒng)霸主地位
從此,微軟奠定了操作系統(tǒng)的霸主之位。而對(duì)應(yīng)的,蘋(píng)果的PC機(jī)市場(chǎng)份額從這一年開(kāi)始迅速下降。結(jié)果就是蘋(píng)果輸?shù)舨僮飨到y(tǒng)之爭(zhēng),整個(gè)市場(chǎng)被微軟壟斷。在確立了操作系統(tǒng)一哥的地位之后,微軟背靠龐大的用戶群體,迅速模仿出了大多數(shù)盈利且重要的軟件產(chǎn)品,并后發(fā)制人,一點(diǎn)點(diǎn)蠶食了各大軟件公司的市場(chǎng)。
其次,自立自強(qiáng)也有關(guān)鍵節(jié)點(diǎn),時(shí)間上永遠(yuǎn)是現(xiàn)在,領(lǐng)域上永遠(yuǎn)是底層生態(tài)的構(gòu)建。曾經(jīng)在操作系統(tǒng)領(lǐng)域,中國(guó)也存在“必須擁有自主知識(shí)軟件操作系統(tǒng)”的共識(shí)。但失一城而丟千地,當(dāng)年沒(méi)能拿下操作系統(tǒng)競(jìng)爭(zhēng)的主動(dòng)權(quán),也導(dǎo)致了互聯(lián)網(wǎng)發(fā)展的長(zhǎng)期被動(dòng)局面。二十一世紀(jì)初,中國(guó)本想以國(guó)產(chǎn)自主研發(fā)的操作系統(tǒng)向國(guó)際巨頭發(fā)起挑戰(zhàn),即紅旗Linux,曾經(jīng)也是響徹一時(shí),但最終遭遇“大潰敗”。
2002年,紅旗宣布與國(guó)產(chǎn)辦公軟件永中合作,將紅旗Linux和永中Office聯(lián)合銷售。但永中office、金山WPS等國(guó)產(chǎn)軟件均基于Linux,這也意味著他們與微軟Office有兼容性問(wèn)題。但2006年,微軟的Office國(guó)際標(biāo)準(zhǔn)(OOXML)通過(guò)后,立馬顯著提升了它在軟件領(lǐng)域和生態(tài)構(gòu)建方面的優(yōu)勢(shì)。最終到來(lái)的是微軟在全球包括中國(guó)市場(chǎng)壓倒性的勝利,國(guó)產(chǎn)桌面操作系統(tǒng)最終日漸式微。
把握關(guān)鍵期,決勝大模型
與操作系統(tǒng)之爭(zhēng)失算一樣,如果中國(guó)在大模型領(lǐng)域失利,好的話像蘋(píng)果一樣落后十年,逮到一次機(jī)會(huì)再卷土重來(lái);不好的話可能就會(huì)像操作系統(tǒng)領(lǐng)域的中國(guó)一樣,完全沒(méi)有自主研發(fā)系統(tǒng),直到下次變革機(jī)會(huì)。而一旦人工智能大模型領(lǐng)域由其他國(guó)家主宰,或者是缺少自主研發(fā)的產(chǎn)品,可能會(huì)引發(fā)更為嚴(yán)重的問(wèn)題,面臨在關(guān)鍵領(lǐng)域被“卡脖子”的風(fēng)險(xiǎn)。
正因如此,把握好人工智能大模型的關(guān)鍵博弈期至關(guān)重要。國(guó)產(chǎn)人工智能大模型,如百度的文心一言,雖然在中文領(lǐng)域展示了自然語(yǔ)言處理與多模態(tài)生成的諸多亮點(diǎn),但就用戶體驗(yàn)而言,文心一言的表現(xiàn)不算驚艷。
包括文心一言在內(nèi),目前國(guó)產(chǎn)大模型與美國(guó)的國(guó)際頂尖大模型相比仍然有一定的差距,涵蓋數(shù)據(jù)訓(xùn)練、算法等方面。但恰恰是落后的時(shí)候,要直面差距、接受批評(píng)、迎頭趕上。自2020年起,中國(guó)的大模型數(shù)量驟增,僅2020年到2021年,中國(guó)大模型數(shù)量就從2個(gè)增至21個(gè),和美國(guó)量級(jí)同等,大幅領(lǐng)先于其他國(guó)家。未來(lái),不管是政府還是資本方面,都應(yīng)給予大模型研發(fā)相關(guān)的企業(yè)和機(jī)構(gòu)更多的支持和寬容,共同推進(jìn)中國(guó)人工智能大模型的發(fā)展。
中國(guó)應(yīng)從國(guó)家戰(zhàn)略科技力量的整體高度出發(fā),組成優(yōu)勢(shì)互補(bǔ)的產(chǎn)業(yè)協(xié)同組合。發(fā)揮科研機(jī)構(gòu)在關(guān)鍵核心技術(shù)上的研究?jī)?yōu)勢(shì),同時(shí)發(fā)揮大型科技企業(yè)在產(chǎn)品化、工程化、場(chǎng)景化、商業(yè)化和數(shù)據(jù)化方面的優(yōu)勢(shì),成為大模型技術(shù)攻關(guān)和應(yīng)用的龍頭。以大型科技企業(yè)+重點(diǎn)科研機(jī)構(gòu)為龍頭,通過(guò)開(kāi)源、合作、眾包和生態(tài)的創(chuàng)新模式,引導(dǎo)高校、科研機(jī)構(gòu)和創(chuàng)新型企業(yè)形成多個(gè)技術(shù)路線的創(chuàng)新生態(tài)群。
《2022中國(guó)大模型發(fā)展白皮書(shū)》指出,以大模型為生態(tài)基座的產(chǎn)業(yè)鏈將成為智能化升級(jí)中可大規(guī)模復(fù)用的基礎(chǔ)設(shè)施,中國(guó)大模型廠商在模型布局方面較為完善,接下來(lái)應(yīng)進(jìn)一步圍繞行業(yè)賦能的廣度和深度持續(xù)探索,不斷夯實(shí)基于大模型的產(chǎn)品建設(shè),推動(dòng)大模型技術(shù)從實(shí)驗(yàn)室走向大規(guī)模落地。
人工智能大模型正在不斷升級(jí)迭代,推出包括交通、能源、金融、醫(yī)療等一系列應(yīng)用大模型,實(shí)現(xiàn)與產(chǎn)業(yè)的深度融合。一方面進(jìn)一步利用數(shù)據(jù)這個(gè)生產(chǎn)要素,提升我國(guó)企業(yè)數(shù)字化和智能化轉(zhuǎn)型的比例,推動(dòng)產(chǎn)業(yè)數(shù)字化進(jìn)程;另一方面,也將為行業(yè)產(chǎn)業(yè)降本增效,創(chuàng)造出新需求、新商業(yè)模式和新的經(jīng)濟(jì)增長(zhǎng)點(diǎn)。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
責(zé)任編輯:Rex_13