《更新書堂》·第378 篇
內(nèi)容來源| 本文摘自中國人民大學(xué)出版社書籍
《ChatGPT:讀懂AI爆發(fā)背后的技術(shù)和產(chǎn)業(yè)邏輯》
(資料圖)
項立剛 劉欣 項天舒 著
責(zé)編| 初心
第 7633 篇深度好文:5324 字 | 14 分鐘閱讀
2023年3月堪稱人類科技史的重要里程碑,以ChatGPT及GPT-4為代表的諸多人工智能產(chǎn)品的發(fā)布震驚了全世界,世人驚嘆于人工智能時代正在加速到來,或興奮或恐懼的情緒也隨之在全球蔓延。
輿論場中各種各樣的聲音不斷刺激著人們敏感的神經(jīng):興奮者說ChatGPT的橫空出世拉開了第四次工業(yè)革命的序幕,人類將由碳基生命進化為硅基生命,借力AI將誕生無數(shù)“超級個體+一個人的商業(yè)帝國”,如幾年前的“互聯(lián)網(wǎng)+”一樣,社會將步入由“AI+”引領(lǐng)的深度數(shù)字時代;
恐懼者說全球范圍內(nèi)的失業(yè)狂潮將不可避免,智能機器人勢必在不遠的將來取代人類統(tǒng)治地球,在強大的AI面前人類不堪一擊,并且還借用《黑客帝國》《終結(jié)者》《機械公敵》《流浪地球》等著名科幻影片的經(jīng)典橋段來表達對AI發(fā)展的恐懼和擔(dān)憂,仿佛世界末日近在眼前!
不同的情緒也引發(fā)了人們的種種困惑:ChatGPT的出現(xiàn)到底意味著什么?ChatGPT將給我們的工作和生活帶來哪些沖擊?
人類會被機器取代嗎?社會會被ChatGPT重塑嗎?機器人會不會自我進化?AI會不會發(fā)展出自己的人格?如何看待AI技術(shù)的發(fā)展?……
對于新生事物,過度吹捧和質(zhì)疑都是不科學(xué)的。
《ChatGPT:讀懂AI爆發(fā)背后的技術(shù)和產(chǎn)業(yè)邏輯》一書就很好地解答了上述諸多困惑。
這是一本兼具專業(yè)水準和深刻洞見的誠意之作,作者是中國通信業(yè)著名觀察家項立剛領(lǐng)銜團隊,三位作者不僅理性審視了ChatGPT的前世、今生和未來,更以冷靜的筆觸和通俗的表達,為讀者厘清專業(yè)基本概念,層層揭開ChatGPT的神秘面紗。
一、為什么火出圈的人工智能產(chǎn)品是聊天機器人
過去,我們記憶中的聊天機器人都是點狀思維的,你問什么,它就回答什么,經(jīng)常前言不搭后語。而ChatGPT結(jié)合上下文的連續(xù)對話功能,讓我們體驗到了和真人互動的流暢性。
ChatGPT 以輕松有趣的AI聊天形態(tài)出現(xiàn),最大限度地降低了使用門檻,能夠在最短時間內(nèi)獲得海量用戶。同時,ChatGPT擁有良好的多語言能力,得以在全球范圍內(nèi)快速推廣。
一切都來得太快了,仿佛一夜之間,我們就進入了一個新的人工智能時代,所以人們驚呼:“我們即將因AI而失業(yè),人類即將被AI 顛覆。”特別是在ChatGPT被頻繁應(yīng)用的領(lǐng)域——程序員、媒體人、文案和翻譯們陷入焦慮,這種焦慮正在更大范圍里蔓延。
ChatGPT這樣的聊天機器人,讓用戶最直接地感受具備大模型處理能力的人工智能可能的表現(xiàn),這種沖擊的意義是深遠的,顯然在人工智能的發(fā)展歷程中,它已經(jīng)邁上了一個新的臺階,這的確是人工智能服務(wù)人類的歷程中跨出的一大步。
僅憑ChatGPT這一款應(yīng)用很難改變世界,但是人工智能技術(shù)一定會改變世界,ChatGPT讓我們看到了人工智能蘊藏著巨大的發(fā)展?jié)摿Α?/span>
二、發(fā)展ChatGPT無法回避的四個難題
1.通用引擎的局限
在專門的引擎中,系統(tǒng)是封閉的,相關(guān)信息是隔絕的,不會形成信息之間的沖突;而在通用的引擎中,沖突的信息共存在一個系統(tǒng)中,而又很難做到對用戶有所判斷。
在這種情況下,要做到生成的內(nèi)容基本準確就是一個無法回避的巨大且極有難度的問題。而且,在通用引擎不斷學(xué)習(xí)的過程中,并沒有一個信息庫作為準確的藍本,不斷被輸入的語料,讓學(xué)習(xí)不斷發(fā)生,系統(tǒng)不斷被訓(xùn)練,大量錯誤的信息又將成為語料的組成部分。
在這種情況下,諸多干擾信息的存在就影響了信息的完整性和準確性。
用一個通用方案來解決所有問題,這看起來很美好,但是要把問題解決到符合商用標準,達到在某一領(lǐng)域非常精準的水平,以我們今天的硬件支持和算力支撐條件來看,還有一定的差距。
到目前為止,ChatGPT還很難變成真正意義上的商用產(chǎn)品,大家在驚嘆于它寫的一些似是而非的內(nèi)容已經(jīng)很有“人”味兒的同時,也會發(fā)現(xiàn)實際上它真正能應(yīng)用于自己的工作和生活中的場景并不多,而且它對于中文的支持遠不如英文。
2.標注的困窘
事實上,ChatGPT的內(nèi)容生成質(zhì)量不僅需要技術(shù)人員去建立模型、優(yōu)化算法、構(gòu)建智能訓(xùn)練的系統(tǒng),同時它還需要大量的外包人員去手動完成數(shù)據(jù)標注。
長期來看,ChatGPT 能否把質(zhì)量做到足以解決大部分問題,讓社會大眾普遍接受,在普遍意義上真正幫助用戶解決問題,標注的質(zhì)量可以說是最大的掣肘,因為這不僅是一個技術(shù)問題,更是一個精細化運營的過程。
面對五花八門的敏感信息所采用的標準將決定ChatGPT 的態(tài)度,它生成的內(nèi)容將會影響很多用戶的判斷和理解。
這一標準的制定,標注人員的選擇,標注質(zhì)量的檢查,檢查標準的制定等,這些都是復(fù)雜的系統(tǒng)性工作,而這些工作在很大程度上決定了ChatGPT的內(nèi)容生成質(zhì)量。
信息標注是一項極其重要的工作,依靠雇用貧窮國家的那些拿著超低工資的社會底層人員來完成,而這些標注者有著極大的文化差異和語言水平差異。
對于中文語境,更是存在數(shù)據(jù)殘缺和可供參與訓(xùn)練的內(nèi)容不足的弊端,如此境況下所做的標注和評分都不夠準確,這些問題也是ChatGPT想要做好中文內(nèi)容存在極高難度的原因之一。
3.無解的安全問題
ChatGPT要做到理解更加全面,它不可能就相同的問題為所有的用戶提供一個共同的答案,而是應(yīng)該根據(jù)用戶的提問,對用戶進行長期跟蹤,并對用戶的立場、態(tài)度、世界觀、年齡、性別、職業(yè)、學(xué)歷等做出判斷,然后根據(jù)這些要素生成符合用戶特點的信息。
然而,這就需要收集更多的用戶數(shù)據(jù),再結(jié)合用戶的使用習(xí)慣和偏好,增進對用戶的了解。
事實證明,以上提到的這些數(shù)據(jù)確實可以幫助ChatGPT更深入地理解用戶,生成更高質(zhì)量的內(nèi)容。
但是,收集用戶數(shù)據(jù),尤其是用戶的使用習(xí)慣,不可避免地會收集用戶的個人信息、興趣愛好、價值取向,乃至個人隱私等方面的一手信息。
這些信息是對一個人增進了解的重要工具,也是窺探用戶信息和用戶隱私的重要工具,對這些數(shù)據(jù)的收集行為不可能繞開監(jiān)管部門的強力審查。
而且,在ChatGPT 的系統(tǒng)中,用戶進行提問,ChatGPT予以回答,但答案是唯一的,這就意味著用戶完全喪失了主導(dǎo)權(quán),ChatGPT給出的內(nèi)容是什么用戶只能被動地接受,用戶完全失去了選擇或判斷的可能性。
安全層面還有一個很大的問題,那就是版權(quán),尤其是進一步發(fā)展,對于圖片內(nèi)容進行處理,被人工智能處理之后的原圖版權(quán),某些人物肖像被人工智能處理后生成新的圖像,很可能產(chǎn)生肖像權(quán)糾紛。
大規(guī)模普及甚至濫用ChatGPT一定會導(dǎo)致信任危機。
對每個主權(quán)國家的政府而言,當ChatGPT大量生成內(nèi)容信息輸出的時候,存在一個重要問題——這些內(nèi)容很多涉及歷史、文化、道德、思想,涉及一個社會的基本價值觀,如果大量青少年使用,勢必會影響下一代的教育和價值判斷。而且它提供給用戶的信息是唯一的,沒有參照,無法選擇,存在一定程度上的灌輸意義。
這相當于將社會道德、思想、價值判斷的定義權(quán)交給了一家商業(yè)公司, 而這家公司是由工程師寫出規(guī)范,由國外低收入群體進行標注,這對于任何一個國家而言,都是不能容忍,也是不可能等閑視之的。
2023年5月,紐約一名執(zhí)業(yè)30年的律師為了幫代理人打贏一場過了訴訟時效的官司,用ChatGPT搜集對自己有利的判例并向法庭提交了相關(guān)文書,結(jié)果其中的6個案例的判決結(jié)果、引語等都是假的。
涉事律師稱,他詢問過ChatGPT案例的真實性,ChatGPT再三確定這些案例是真實的,且在“可信的法律數(shù)據(jù)庫”中可以查找到。輕信ChatGPT“一本正經(jīng)的胡說八道”讓他感到非常后悔,涉事律師和其所在律所也因此被處以5000美元的罰款。
這起事件不僅僅對法律界有著重要的警示作用,也應(yīng)該引起各行各業(yè)的重視。始終保持對人工智能的審慎態(tài)度,將其作為輔助工具而不是絕對的決策依據(jù),才能避免因依賴人工智能而導(dǎo)致的風(fēng)險和問題,能夠明智地為社會和業(yè)務(wù)帶來長期的益處。
4.如何參與社會實踐
今天我們看到的人工智能所有能力的形成,無外乎一種模式:建立模型,通過大量信息進行標注,一次次排序、打分,生成內(nèi)容,對內(nèi)容進行分析、打分,再進行訓(xùn)練,最后漸漸讓內(nèi)容達到比較符合人類思維的水平。
人工智能目前還是在人類的輔助下,通過算法、模型、人工標注來提升能力,由于人工智能面對的是大量的、不斷更新的知識,如果要形成自我學(xué)習(xí)的能力,就需要其親自參與社會實踐,在社會實踐中去理解邏輯,形成思維能力,對社會實踐的過程進行歸納、總結(jié)、演繹、推理,從而形成真正的智力。
目前來看,談人工智能達到這一步還為時過早,對ChatGPT這樣一個聊天機器人而言,它的功能還是較為單一的,還是要依賴人類的算法、模型和標注,我們現(xiàn)在沒有必要為人工智能的自我學(xué)習(xí)能力、自我意識而焦慮。
人工智能包含算法、數(shù)據(jù)、算力三大核心要素,面對信息時代近乎無限的內(nèi)容,如何收集和篩選數(shù)據(jù)是人工智能要邁過的第一道坎,也是人工智能想要融入社會實踐必須解決的難題。
互聯(lián)網(wǎng)上有太多低質(zhì)量甚至無效的有害信息,如果一直把這些垃圾當成養(yǎng)料投喂給大模型,其生成的內(nèi)容質(zhì)量必然大打折扣。
在社會實踐方面,華為盤古大模型就為大模型如何改造社會生產(chǎn)力提供了一個很好的觀察樣本。2023年7月18日,山東能源集團、華為、云鼎科技在濟南聯(lián)手發(fā)布全球首個商用于能源行業(yè)的AI大模型——盤古礦山大模型。
作為AI大模型在能源領(lǐng)域的全球首次商用,山東能源、云鼎科技、華為在前期試點驗證AI大模型賦能工業(yè)生產(chǎn)領(lǐng)域的基礎(chǔ)上,正在開發(fā)和實施首批場景應(yīng)用,涵蓋采煤、掘進、主運、輔運、提升、安監(jiān)、防沖、洗選、焦化9個專業(yè)21個場景應(yīng)用,切實做到了降本增效,并且還在持續(xù)地加以改進和探索。
相比之下,把大模型的能力應(yīng)用于聊天機器人,被各路網(wǎng)友以各種奇葩問答“調(diào)戲”,ChatGPT更像是一個新奇的玩具而非改造生產(chǎn)力的工具了。
三、用系統(tǒng)思維看待人工智能的產(chǎn)業(yè)應(yīng)用前景
人工智能由信息采集、信息存儲、信息傳輸、算法、大模型、信息加工等諸多環(huán)節(jié)組成,并在此基礎(chǔ)上形成決策機制,所有環(huán)節(jié)都不能脫離大系統(tǒng)而獨立發(fā)展,更不可能因為某個環(huán)節(jié)發(fā)展得好就超越了大系統(tǒng),它只能是大系統(tǒng)的一部分,帶動整個大系統(tǒng)的發(fā)展。
不要簡單地把人工智能僅僅視為一項研究、一套算法或一個模型,它必然是一個龐大系統(tǒng),要用系統(tǒng)的眼光去看待人工智能的發(fā)展和應(yīng)用。
看一個國家的人工智能發(fā)展水平如何,只能看這個大系統(tǒng)的整體發(fā)展情況,因為人工智能最終是要為社會服務(wù)的,人工智能需要在每一個環(huán)節(jié)都形成匹配,設(shè)想利用單點突破而一舉攻克整個系統(tǒng)的難點,顯然是不切實際的。
人工智能要成為一種有價值的能力,就不可能單獨存在,需要和眾多的傳統(tǒng)能力結(jié)合起來提高效率。
人工智能一定要介入社會生活的諸多領(lǐng)域,對社會管理、社會運營、生活服務(wù)、交通運輸、生產(chǎn)制造產(chǎn)生革命性影響,讓這些領(lǐng)域的效率更高、能力更強、成本更低,讓很多以往不可能實現(xiàn)的能力因為人工智能的助力而得以實現(xiàn)。
人工智能要成為一個良好的服務(wù)系統(tǒng),必須走軟硬件一體化的道路,需要軟硬件同步發(fā)展,除了傳統(tǒng)的電腦和智能手機,未來人工智能一定會用在智能汽車、無人船、無人機、智能電網(wǎng)、智慧工廠、智慧醫(yī)療等眾多的領(lǐng)域,很多傳統(tǒng)行業(yè)面臨著自身的改造,需要主動適應(yīng)人工智能的要求,成為智能體系的一部分。
而這些領(lǐng)域要完成改造,需要一個漫長的接受過程,需要時間,也需要探索。今天全球的人工智能發(fā)展還剛剛開始,還遠遠沒完善到可以影響人類生存的程度。
對于人工智能的發(fā)展,人類大可不必如此焦慮。今天,對于從基礎(chǔ)建設(shè)做起,提升算力,加大存儲中心的建設(shè),加強智算能力, 建立更多把人工智能和傳統(tǒng)領(lǐng)域結(jié)合起來的接口,智能互聯(lián)網(wǎng)還有一段漫長的道路。
從基礎(chǔ)設(shè)施到算力、數(shù)據(jù),再到應(yīng)用能力,遠遠沒有強大到需要焦慮的程度。人類不需要抵制人工智能,而應(yīng)該擁抱人工智能,抓住人工智能發(fā)展的機會,讓人類文明達到新的高度。
除了以上核心觀點外,本書還立足于互聯(lián)網(wǎng)發(fā)展階段和信息傳播演化的歷史經(jīng)緯,著眼于中美兩大科技強國的人工智能和通信產(chǎn)業(yè)的發(fā)展縱橫,用極富創(chuàng)新性的觀察視角大膽暢想并系統(tǒng)性地闡述了AI的產(chǎn)業(yè)應(yīng)用前景、前沿趨勢與挑戰(zhàn)。
擁抱、跟蹤一切技術(shù)突破,不斷完善自己的能力,這才是技術(shù)發(fā)展的開放心態(tài)。
這本書既不側(cè)重于技術(shù)講解,也不構(gòu)成投資建議,更多的是幫助讀者了解技術(shù)創(chuàng)新給社會帶來的沖擊變化和潛在機遇,讓人們面對新生事物不再霧里看花、人云亦云。
四、結(jié)語
看多了科幻大片,我們總會把“改變世界”想象成一個突如其來的偉大創(chuàng)舉,但事實上,人類世界正以肉眼可見的速度實現(xiàn)著數(shù)據(jù)化,恰恰是成千上萬人聚合后的數(shù)據(jù)張力,讓人工智能有可能站上最關(guān)鍵的位置,成為聯(lián)結(jié)虛擬與現(xiàn)實的核心入口。
在理解自然和社會的基礎(chǔ)上,構(gòu)建技術(shù)應(yīng)用場景,推動產(chǎn)業(yè)進步的人類實踐,最終推動著文明的進程。作為技術(shù)革命的人工智能,也不會是瞬間綻放在夜空的絢爛煙火,而是一次次腳踏實地、攀向高峰的前進步伐。
AI爆發(fā)已經(jīng)引發(fā)了劍指下一代互聯(lián)網(wǎng)主導(dǎo)權(quán)的“軍備競賽”,事態(tài)的走向和變化都有待我們持續(xù)地關(guān)注和觀察,也希望能和各界的讀者朋友們一起見證歷史和人類文明的未來!
*文章為作者獨立觀點,不代表筆記俠立場。
9月16日,筆記俠“AI新視野,增長新勢能”第二屆新商業(yè)智能大會,將在杭州寶盛水博園大酒店舉辦。
眾多行業(yè)大咖、一線企業(yè)、初創(chuàng)公司在這里聚集,分享彼此對AI的認知和經(jīng)驗,幫你發(fā)現(xiàn)AI帶來的增長勢能,看到未來,融入未來,成為未來!
余票不多,先到先得。
分享、點贊、在看,3連
責(zé)任編輯:Rex_18