《更新書堂》·第378 篇
(資料圖片)
內容來源| 本文摘自中國人民大學出版社書籍
《ChatGPT:讀懂AI爆發背后的技術和產業邏輯》
項立剛 劉欣 項天舒 著
責編| 初心
第 7633 篇深度好文:5324 字 | 14 分鐘閱讀
2023年3月堪稱人類科技史的重要里程碑,以ChatGPT及GPT-4為代表的諸多人工智能產品的發布震驚了全世界,世人驚嘆于人工智能時代正在加速到來,或興奮或恐懼的情緒也隨之在全球蔓延。
輿論場中各種各樣的聲音不斷刺激著人們敏感的神經:興奮者說ChatGPT的橫空出世拉開了第四次工業革命的序幕,人類將由碳基生命進化為硅基生命,借力AI將誕生無數“超級個體+一個人的商業帝國”,如幾年前的“互聯網+”一樣,社會將步入由“AI+”引領的深度數字時代;
恐懼者說全球范圍內的失業狂潮將不可避免,智能機器人勢必在不遠的將來取代人類統治地球,在強大的AI面前人類不堪一擊,并且還借用《黑客帝國》《終結者》《機械公敵》《流浪地球》等著名科幻影片的經典橋段來表達對AI發展的恐懼和擔憂,仿佛世界末日近在眼前!
不同的情緒也引發了人們的種種困惑:ChatGPT的出現到底意味著什么?ChatGPT將給我們的工作和生活帶來哪些沖擊?
人類會被機器取代嗎?社會會被ChatGPT重塑嗎?機器人會不會自我進化?AI會不會發展出自己的人格?如何看待AI技術的發展?……
對于新生事物,過度吹捧和質疑都是不科學的。
《ChatGPT:讀懂AI爆發背后的技術和產業邏輯》一書就很好地解答了上述諸多困惑。
這是一本兼具專業水準和深刻洞見的誠意之作,作者是中國通信業著名觀察家項立剛領銜團隊,三位作者不僅理性審視了ChatGPT的前世、今生和未來,更以冷靜的筆觸和通俗的表達,為讀者厘清專業基本概念,層層揭開ChatGPT的神秘面紗。
一、為什么火出圈的人工智能產品是聊天機器人
過去,我們記憶中的聊天機器人都是點狀思維的,你問什么,它就回答什么,經常前言不搭后語。而ChatGPT結合上下文的連續對話功能,讓我們體驗到了和真人互動的流暢性。
ChatGPT 以輕松有趣的AI聊天形態出現,最大限度地降低了使用門檻,能夠在最短時間內獲得海量用戶。同時,ChatGPT擁有良好的多語言能力,得以在全球范圍內快速推廣。
一切都來得太快了,仿佛一夜之間,我們就進入了一個新的人工智能時代,所以人們驚呼:“我們即將因AI而失業,人類即將被AI 顛覆。”特別是在ChatGPT被頻繁應用的領域——程序員、媒體人、文案和翻譯們陷入焦慮,這種焦慮正在更大范圍里蔓延。
ChatGPT這樣的聊天機器人,讓用戶最直接地感受具備大模型處理能力的人工智能可能的表現,這種沖擊的意義是深遠的,顯然在人工智能的發展歷程中,它已經邁上了一個新的臺階,這的確是人工智能服務人類的歷程中跨出的一大步。
僅憑ChatGPT這一款應用很難改變世界,但是人工智能技術一定會改變世界,ChatGPT讓我們看到了人工智能蘊藏著巨大的發展潛力。
二、發展ChatGPT無法回避的四個難題
1.通用引擎的局限
在專門的引擎中,系統是封閉的,相關信息是隔絕的,不會形成信息之間的沖突;而在通用的引擎中,沖突的信息共存在一個系統中,而又很難做到對用戶有所判斷。
在這種情況下,要做到生成的內容基本準確就是一個無法回避的巨大且極有難度的問題。而且,在通用引擎不斷學習的過程中,并沒有一個信息庫作為準確的藍本,不斷被輸入的語料,讓學習不斷發生,系統不斷被訓練,大量錯誤的信息又將成為語料的組成部分。
在這種情況下,諸多干擾信息的存在就影響了信息的完整性和準確性。
用一個通用方案來解決所有問題,這看起來很美好,但是要把問題解決到符合商用標準,達到在某一領域非常精準的水平,以我們今天的硬件支持和算力支撐條件來看,還有一定的差距。
到目前為止,ChatGPT還很難變成真正意義上的商用產品,大家在驚嘆于它寫的一些似是而非的內容已經很有“人”味兒的同時,也會發現實際上它真正能應用于自己的工作和生活中的場景并不多,而且它對于中文的支持遠不如英文。
2.標注的困窘
事實上,ChatGPT的內容生成質量不僅需要技術人員去建立模型、優化算法、構建智能訓練的系統,同時它還需要大量的外包人員去手動完成數據標注。
長期來看,ChatGPT 能否把質量做到足以解決大部分問題,讓社會大眾普遍接受,在普遍意義上真正幫助用戶解決問題,標注的質量可以說是最大的掣肘,因為這不僅是一個技術問題,更是一個精細化運營的過程。
面對五花八門的敏感信息所采用的標準將決定ChatGPT 的態度,它生成的內容將會影響很多用戶的判斷和理解。
這一標準的制定,標注人員的選擇,標注質量的檢查,檢查標準的制定等,這些都是復雜的系統性工作,而這些工作在很大程度上決定了ChatGPT的內容生成質量。
信息標注是一項極其重要的工作,依靠雇用貧窮國家的那些拿著超低工資的社會底層人員來完成,而這些標注者有著極大的文化差異和語言水平差異。
對于中文語境,更是存在數據殘缺和可供參與訓練的內容不足的弊端,如此境況下所做的標注和評分都不夠準確,這些問題也是ChatGPT想要做好中文內容存在極高難度的原因之一。
3.無解的安全問題
ChatGPT要做到理解更加全面,它不可能就相同的問題為所有的用戶提供一個共同的答案,而是應該根據用戶的提問,對用戶進行長期跟蹤,并對用戶的立場、態度、世界觀、年齡、性別、職業、學歷等做出判斷,然后根據這些要素生成符合用戶特點的信息。
然而,這就需要收集更多的用戶數據,再結合用戶的使用習慣和偏好,增進對用戶的了解。
事實證明,以上提到的這些數據確實可以幫助ChatGPT更深入地理解用戶,生成更高質量的內容。
但是,收集用戶數據,尤其是用戶的使用習慣,不可避免地會收集用戶的個人信息、興趣愛好、價值取向,乃至個人隱私等方面的一手信息。
這些信息是對一個人增進了解的重要工具,也是窺探用戶信息和用戶隱私的重要工具,對這些數據的收集行為不可能繞開監管部門的強力審查。
而且,在ChatGPT 的系統中,用戶進行提問,ChatGPT予以回答,但答案是唯一的,這就意味著用戶完全喪失了主導權,ChatGPT給出的內容是什么用戶只能被動地接受,用戶完全失去了選擇或判斷的可能性。
安全層面還有一個很大的問題,那就是版權,尤其是進一步發展,對于圖片內容進行處理,被人工智能處理之后的原圖版權,某些人物肖像被人工智能處理后生成新的圖像,很可能產生肖像權糾紛。
大規模普及甚至濫用ChatGPT一定會導致信任危機。
對每個主權國家的政府而言,當ChatGPT大量生成內容信息輸出的時候,存在一個重要問題——這些內容很多涉及歷史、文化、道德、思想,涉及一個社會的基本價值觀,如果大量青少年使用,勢必會影響下一代的教育和價值判斷。而且它提供給用戶的信息是唯一的,沒有參照,無法選擇,存在一定程度上的灌輸意義。
這相當于將社會道德、思想、價值判斷的定義權交給了一家商業公司, 而這家公司是由工程師寫出規范,由國外低收入群體進行標注,這對于任何一個國家而言,都是不能容忍,也是不可能等閑視之的。
2023年5月,紐約一名執業30年的律師為了幫代理人打贏一場過了訴訟時效的官司,用ChatGPT搜集對自己有利的判例并向法庭提交了相關文書,結果其中的6個案例的判決結果、引語等都是假的。
涉事律師稱,他詢問過ChatGPT案例的真實性,ChatGPT再三確定這些案例是真實的,且在“可信的法律數據庫”中可以查找到。輕信ChatGPT“一本正經的胡說八道”讓他感到非常后悔,涉事律師和其所在律所也因此被處以5000美元的罰款。
這起事件不僅僅對法律界有著重要的警示作用,也應該引起各行各業的重視。始終保持對人工智能的審慎態度,將其作為輔助工具而不是絕對的決策依據,才能避免因依賴人工智能而導致的風險和問題,能夠明智地為社會和業務帶來長期的益處。
4.如何參與社會實踐
今天我們看到的人工智能所有能力的形成,無外乎一種模式:建立模型,通過大量信息進行標注,一次次排序、打分,生成內容,對內容進行分析、打分,再進行訓練,最后漸漸讓內容達到比較符合人類思維的水平。
人工智能目前還是在人類的輔助下,通過算法、模型、人工標注來提升能力,由于人工智能面對的是大量的、不斷更新的知識,如果要形成自我學習的能力,就需要其親自參與社會實踐,在社會實踐中去理解邏輯,形成思維能力,對社會實踐的過程進行歸納、總結、演繹、推理,從而形成真正的智力。
目前來看,談人工智能達到這一步還為時過早,對ChatGPT這樣一個聊天機器人而言,它的功能還是較為單一的,還是要依賴人類的算法、模型和標注,我們現在沒有必要為人工智能的自我學習能力、自我意識而焦慮。
人工智能包含算法、數據、算力三大核心要素,面對信息時代近乎無限的內容,如何收集和篩選數據是人工智能要邁過的第一道坎,也是人工智能想要融入社會實踐必須解決的難題。
互聯網上有太多低質量甚至無效的有害信息,如果一直把這些垃圾當成養料投喂給大模型,其生成的內容質量必然大打折扣。
在社會實踐方面,華為盤古大模型就為大模型如何改造社會生產力提供了一個很好的觀察樣本。2023年7月18日,山東能源集團、華為、云鼎科技在濟南聯手發布全球首個商用于能源行業的AI大模型——盤古礦山大模型。
作為AI大模型在能源領域的全球首次商用,山東能源、云鼎科技、華為在前期試點驗證AI大模型賦能工業生產領域的基礎上,正在開發和實施首批場景應用,涵蓋采煤、掘進、主運、輔運、提升、安監、防沖、洗選、焦化9個專業21個場景應用,切實做到了降本增效,并且還在持續地加以改進和探索。
相比之下,把大模型的能力應用于聊天機器人,被各路網友以各種奇葩問答“調戲”,ChatGPT更像是一個新奇的玩具而非改造生產力的工具了。
三、用系統思維看待人工智能的產業應用前景
人工智能由信息采集、信息存儲、信息傳輸、算法、大模型、信息加工等諸多環節組成,并在此基礎上形成決策機制,所有環節都不能脫離大系統而獨立發展,更不可能因為某個環節發展得好就超越了大系統,它只能是大系統的一部分,帶動整個大系統的發展。
不要簡單地把人工智能僅僅視為一項研究、一套算法或一個模型,它必然是一個龐大系統,要用系統的眼光去看待人工智能的發展和應用。
看一個國家的人工智能發展水平如何,只能看這個大系統的整體發展情況,因為人工智能最終是要為社會服務的,人工智能需要在每一個環節都形成匹配,設想利用單點突破而一舉攻克整個系統的難點,顯然是不切實際的。
人工智能要成為一種有價值的能力,就不可能單獨存在,需要和眾多的傳統能力結合起來提高效率。
人工智能一定要介入社會生活的諸多領域,對社會管理、社會運營、生活服務、交通運輸、生產制造產生革命性影響,讓這些領域的效率更高、能力更強、成本更低,讓很多以往不可能實現的能力因為人工智能的助力而得以實現。
人工智能要成為一個良好的服務系統,必須走軟硬件一體化的道路,需要軟硬件同步發展,除了傳統的電腦和智能手機,未來人工智能一定會用在智能汽車、無人船、無人機、智能電網、智慧工廠、智慧醫療等眾多的領域,很多傳統行業面臨著自身的改造,需要主動適應人工智能的要求,成為智能體系的一部分。
而這些領域要完成改造,需要一個漫長的接受過程,需要時間,也需要探索。今天全球的人工智能發展還剛剛開始,還遠遠沒完善到可以影響人類生存的程度。
對于人工智能的發展,人類大可不必如此焦慮。今天,對于從基礎建設做起,提升算力,加大存儲中心的建設,加強智算能力, 建立更多把人工智能和傳統領域結合起來的接口,智能互聯網還有一段漫長的道路。
從基礎設施到算力、數據,再到應用能力,遠遠沒有強大到需要焦慮的程度。人類不需要抵制人工智能,而應該擁抱人工智能,抓住人工智能發展的機會,讓人類文明達到新的高度。
除了以上核心觀點外,本書還立足于互聯網發展階段和信息傳播演化的歷史經緯,著眼于中美兩大科技強國的人工智能和通信產業的發展縱橫,用極富創新性的觀察視角大膽暢想并系統性地闡述了AI的產業應用前景、前沿趨勢與挑戰。
擁抱、跟蹤一切技術突破,不斷完善自己的能力,這才是技術發展的開放心態。
這本書既不側重于技術講解,也不構成投資建議,更多的是幫助讀者了解技術創新給社會帶來的沖擊變化和潛在機遇,讓人們面對新生事物不再霧里看花、人云亦云。
四、結語
看多了科幻大片,我們總會把“改變世界”想象成一個突如其來的偉大創舉,但事實上,人類世界正以肉眼可見的速度實現著數據化,恰恰是成千上萬人聚合后的數據張力,讓人工智能有可能站上最關鍵的位置,成為聯結虛擬與現實的核心入口。
在理解自然和社會的基礎上,構建技術應用場景,推動產業進步的人類實踐,最終推動著文明的進程。作為技術革命的人工智能,也不會是瞬間綻放在夜空的絢爛煙火,而是一次次腳踏實地、攀向高峰的前進步伐。
AI爆發已經引發了劍指下一代互聯網主導權的“軍備競賽”,事態的走向和變化都有待我們持續地關注和觀察,也希望能和各界的讀者朋友們一起見證歷史和人類文明的未來!
*文章為作者獨立觀點,不代表筆記俠立場。
9月16日,筆記俠“AI新視野,增長新勢能”第二屆新商業智能大會,將在杭州寶盛水博園大酒店舉辦。
眾多行業大咖、一線企業、初創公司在這里聚集,分享彼此對AI的認知和經驗,幫你發現AI帶來的增長勢能,看到未來,融入未來,成為未來!
余票不多,先到先得。
分享、點贊、在看,3連
責任編輯:Rex_18