【文/觀察者網專欄作者 劉典】
2023年無疑是生成式人工智能的關鍵一年,就在這個4月,一場大模型風暴已經來臨:
4月8-9日,華為盤古大模型發布會;4月10日,商湯大模型發布會;4月11日,阿里大模型發布會;4月14日,同花順AI產品發布會;4月18日,阿里行業類模型發布會……
(相關資料圖)
生成式人工智能進步的速度令人瞠目結舌。僅僅在ChatGPT發布幾個月后,新的人工智能就已經再次進化出重大升級——GPT-4擁有了多模態的能力,不僅能看懂文字,也能看懂圖片了。與此同時,微軟將ChatGPT整合到必應搜索中,同時將GPT-4融入微軟365,旨在打破辦公套件的行業格局。
沒幾天,OpenAI首席執行官山姆·阿爾特曼在Twitter上宣布了一條消息:我們正在推出ChatGPT插件,您可以通過安裝插件來有效地完成各種任務。我們非常期待看到開發人員創造出來的新東西!
一時間,數百億、千億乃至萬億級參數規模的人工智能大模型相繼涌現,這場ChatGPT引發的全球大模型競爭趨于日趨激烈,這也意味著其背后的人工智能大模型開始進入市場激烈爭奪和技術快速迭代的關鍵博弈期。而這場大模型的競爭很可能像九十年代PC操作系統的競爭一樣,具有“壟斷性”的傾向和趨勢,一旦輸掉競爭,就可能會失掉整個市場。
GPT-4擁有了多模態的能力,不僅能看懂文字,也能看懂圖片了
大模型進入博弈期
GPT-4的發布在各個領域引起了巨大的轟動,因為它在人工智能技術中達到了一個新的高度。在某些領域,GPT-4已經顯露出了其絕對優勢,或者說“AI霸權”。
這里說的“霸權”不是政治學里面的操縱或控制其他國家的地位,類似于之前為人所知的“量子霸權”的說法,即在某一領域產生原有工具遠不能及的技術優勢。比如應用了GPT-4的Office辦公軟件,只要人們動動嘴(輸入想要的期待),從Word到Excel再到PPT,普通人工可能需要一天完成的工作,人工智能幾乎就是一瞬間的事情。更不用提ChatGPT在編程領域及基礎文案工作上已經逐步產生可觀的生產力了。這將大大降低所謂的“工程師紅利”,而未來通過創新產生的競爭力比重將繼續增大,節約下來的人工可以解放出更多的創新生產力。能否盡快實現“AI霸權”,會成為未來實現創新性國家的一塊重要基石。
GPT-4以及眾多生成式人工智能的背后,是人工智能大模型的訓練結果。隨著如ChatGPT和文心一言逐漸進入應用和商業層面,背后的各個大模型也進入關鍵博弈期。中國能否在未來數年內推出自己的大模型成為關鍵。
從參數規模來看,國內已經誕生了能夠比肩ChatGPT參數量的大模型。有與美國一拼高下的基礎和潛力。而大模型競爭之所以時間緊迫,有這么幾個考慮。
大模型競爭同時也是一場市場爭奪戰。先占領市場、研發排他性強獨占性強的優勢產品,既是大廠企業的競爭策略,也是優勢廠家的競爭結果。目前,谷歌推出類似ChatGPT的大模型Bard之后,谷歌與微軟的競爭再起:微軟正聚焦在B端(如辦公軟件、云計算和人工智能相關產品)以及游戲等相關領域,而谷歌則在C端市場、互聯網領域推出更多定制化產品。而不管是B端還是C端,對這些優勢產品必然有依賴性,這樣的依賴性也將是這些產品繼續在所處賽道擴大優勢的重要方式。
對于那些獲得大模型先手優勢的企業來說,在這輪競爭中更容易積累“數據雪球”、建立“數據壁壘”。在自然語言處理領域,數據是訓練大型語言模型的基礎,因此擁有高質量的數據集是非常重要的。以ChatGPT為例,在ChatGPT的發展過程中,通過搶先開始公測并收集用戶數據,OpenAI獲得了巨大的先發優勢。這些數據不僅有助于優化ChatGPT的性能和提升用戶體驗,還可以用于訓練更加先進的大型語言模型,從而擴大數據優勢。而這部分寶貴的數據被微軟獨家占有。
為了持續維護數據壁壘,OpenAI需要不斷地投入資金和人力資源進行數據采集、標注和更新,同時不斷改進模型算法和優化性能,以確保ChatGPT始終是最好用的自然語言處理類大模型,而只要ChatGPT仍然是最好用的自然語言處理類大模型,這個“雪球”就會越滾越大,其他企業將越來越難追上,從而進一步擴大“雪球”效應,鞏固其在市場上的領先地位。
此外,擁有市場和壁壘的企業將進一步對國際標準制定發起進攻。人工智能大模型的國際標準領域,包括模型的設計和開發標準、模型的應用和部署標準、模型的數據隱私和安全標準、模型的倫理和社會責任標準、模型的性能和效果評價標準等等。在某一市場和領域,通過制定國際標準,企業可以獲得更廣泛的認可和市場份額。特別是對一些排他性的技術、軟件和產品,一旦國際標準被確定下來,制定標準者將能夠決定市場走向。
就拿模型的數據隱私和安全標準來說,包括模型在數據收集、存儲、傳輸、使用等方面的隱私和安全標準,目的是確保模型對用戶數據的隱私和安全有一定的保障,避免出現數據泄露和濫用等問題。而一旦一些大模型擁有了這方面的標準制定權或優勢,將更易于將自己的大模型推廣出去,成為具有壟斷性的產品。
除此之外,如果大模型與應用端的廠家也向國際標準制定發起進攻,很有可能以后一些軟件和產品也會出現獨特的標準,就像當年微軟的office標準OOXML一樣。一旦這樣的標準出現了,其他大模型連接的產品無法接入,勢必就會逐漸敗落。
因此未來幾年大模型進入關鍵博弈期,它的市場競爭或許可以參考操作當年微軟和蘋果、中國與微軟系統競爭的經驗和教訓。
從操作系統之爭看大模型之戰
之所以說大模型的競爭很可能像九十年代PC操作系統的競爭一樣,具有“壟斷性”的傾向和趨勢,其本質還是在于大模型和操作系統一樣,都是一個技術新時代的“基礎設施”。如同需要搭乘操作系統的軟件一樣,所有的人工智能產品,尤其是生成式人工智能,乃至未來可能的通用型人工智能,都需要依靠背后的人工智能大模型才能完成訓練、輸出等一系列動作。
2020年中國計算機操作系統市場份額占比圖
而這樣的大模型,與操作系統一樣具有壟斷性的特點。一方面,不管是大模型還是操作系統,它們的競爭都是不同生態之間的競爭。正如中科院院士倪光南所說,操作系統的成功與否,關鍵在于生態系統,需要能夠搭建起完整的軟件開發者、芯片企業、終端企業、運營商等產業鏈上的各個主體。大模型也是同樣的道理,一個優秀的大模型也將會建立起一套排他性強、獨占性強的生態系統。
另一方面,一旦某一個大模型或操作系統占領了市場,它將獲得相對于其他后來者無可比擬的優勢。這既是由于人們對于生態系統產生路徑依賴,也是源于大模型的數據特點,優秀的大模型將能吸引到更多數據,滾起“數據雪球”。而這樣的大模型,也將成為人們唯一選擇和依賴的大模型,最終形成對于大模型的依賴,后來者很難再通過同樣的路徑對其進行趕超。
大模型的出現、爭奪過程、以及失利之后的慘痛后果,或許都可以從九十年代到二十一世紀初的操作系統之爭中找到。
首先,先發者不一定制人,但爭霸即是巔峰。而如操作系統的稱霸之于軟件的壓倒性作用一樣,大模型的爭霸,很有可能導致整個應用端的生態變成“零合競爭”的戰場。與大模型的出現一樣,當年微軟的Windows3和蘋果的Macintosh,是兩個劃時代的同類產品之間的競爭。
1984年,蘋果的Macintosh正式發布,這是第一款圖形化操作系統。但在當時,Macintosh由于兼容性太差,售價過高,市場反響平平。1990年,微軟也推出了自己的圖形化操作系統——Windows 3。憑借此前積累的眾多用戶,該系統一經推出,就得到了迅速推廣,占領了Macintosh的市場。
微軟靠Windows3贏得了操作系統霸主地位
從此,微軟奠定了操作系統的霸主之位。而對應的,蘋果的PC機市場份額從這一年開始迅速下降。結果就是蘋果輸掉操作系統之爭,整個市場被微軟壟斷。在確立了操作系統一哥的地位之后,微軟背靠龐大的用戶群體,迅速模仿出了大多數盈利且重要的軟件產品,并后發制人,一點點蠶食了各大軟件公司的市場。
其次,自立自強也有關鍵節點,時間上永遠是現在,領域上永遠是底層生態的構建。曾經在操作系統領域,中國也存在“必須擁有自主知識軟件操作系統”的共識。但失一城而丟千地,當年沒能拿下操作系統競爭的主動權,也導致了互聯網發展的長期被動局面。二十一世紀初,中國本想以國產自主研發的操作系統向國際巨頭發起挑戰,即紅旗Linux,曾經也是響徹一時,但最終遭遇“大潰敗”。
2002年,紅旗宣布與國產辦公軟件永中合作,將紅旗Linux和永中Office聯合銷售。但永中office、金山WPS等國產軟件均基于Linux,這也意味著他們與微軟Office有兼容性問題。但2006年,微軟的Office國際標準(OOXML)通過后,立馬顯著提升了它在軟件領域和生態構建方面的優勢。最終到來的是微軟在全球包括中國市場壓倒性的勝利,國產桌面操作系統最終日漸式微。
把握關鍵期,決勝大模型
與操作系統之爭失算一樣,如果中國在大模型領域失利,好的話像蘋果一樣落后十年,逮到一次機會再卷土重來;不好的話可能就會像操作系統領域的中國一樣,完全沒有自主研發系統,直到下次變革機會。而一旦人工智能大模型領域由其他國家主宰,或者是缺少自主研發的產品,可能會引發更為嚴重的問題,面臨在關鍵領域被“卡脖子”的風險。
正因如此,把握好人工智能大模型的關鍵博弈期至關重要。國產人工智能大模型,如百度的文心一言,雖然在中文領域展示了自然語言處理與多模態生成的諸多亮點,但就用戶體驗而言,文心一言的表現不算驚艷。
包括文心一言在內,目前國產大模型與美國的國際頂尖大模型相比仍然有一定的差距,涵蓋數據訓練、算法等方面。但恰恰是落后的時候,要直面差距、接受批評、迎頭趕上。自2020年起,中國的大模型數量驟增,僅2020年到2021年,中國大模型數量就從2個增至21個,和美國量級同等,大幅領先于其他國家。未來,不管是政府還是資本方面,都應給予大模型研發相關的企業和機構更多的支持和寬容,共同推進中國人工智能大模型的發展。
中國應從國家戰略科技力量的整體高度出發,組成優勢互補的產業協同組合。發揮科研機構在關鍵核心技術上的研究優勢,同時發揮大型科技企業在產品化、工程化、場景化、商業化和數據化方面的優勢,成為大模型技術攻關和應用的龍頭。以大型科技企業+重點科研機構為龍頭,通過開源、合作、眾包和生態的創新模式,引導高校、科研機構和創新型企業形成多個技術路線的創新生態群。
《2022中國大模型發展白皮書》指出,以大模型為生態基座的產業鏈將成為智能化升級中可大規模復用的基礎設施,中國大模型廠商在模型布局方面較為完善,接下來應進一步圍繞行業賦能的廣度和深度持續探索,不斷夯實基于大模型的產品建設,推動大模型技術從實驗室走向大規模落地。
人工智能大模型正在不斷升級迭代,推出包括交通、能源、金融、醫療等一系列應用大模型,實現與產業的深度融合。一方面進一步利用數據這個生產要素,提升我國企業數字化和智能化轉型的比例,推動產業數字化進程;另一方面,也將為行業產業降本增效,創造出新需求、新商業模式和新的經濟增長點。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。
責任編輯:Rex_13