【CSDN 編者按】OpenAI 總裁格雷格?布羅克曼:GPT-4 并不完美但絕對與眾不同。
原文鏈接:https://techcrunch.com/2023/03/15/interview-with-openais-greg-brockman-gpt-4-isnt-perfect-but-neither-are-you/
整理 | 王子彧
(相關(guān)資料圖)
出品 | CSDN(ID:CSDNnews)
3月15日,繼 ChatGPT 展現(xiàn)了驚人的實(shí)力之后,OpenAI 又扔下了一顆核彈:備受期待的史上最強(qiáng)人工智能大模型 GPT-4 發(fā)布 了。
據(jù) TechCrunch 消息,OpenAI 聯(lián)合創(chuàng)始人兼總裁格雷格?布羅克曼在接受記者凱爾·威格斯采訪時(shí)表示,GPT-4 并不完美但絕對與眾不同,并且他還在采訪中透露, OpenAI 正在測試 GPT-4 高級版本,是普通 GPT-4 儲存內(nèi)容能力的 5 倍。本文對這篇采訪進(jìn)行了編譯,以饗讀者。
關(guān)鍵改進(jìn):多模態(tài)能力
GPT-4 在其前身 GPT-3 的基礎(chǔ)上,對很多方面做了關(guān)鍵性的改進(jìn)。例如提供了更多真實(shí)的聲明,并允許開發(fā)者更容易設(shè)計(jì)其風(fēng)格和行為。同時(shí),GPT-4 也是多模態(tài)的,它可以可以接受圖像作為輸入并生成標(biāo)題、分類和分析。
但 GPT-4 也有局限性。和 GPT-3 一樣,該模型對事實(shí)產(chǎn)生了 "幻覺",并出現(xiàn)了基本的推理錯誤。OpenAI 在自己的博客上舉了個例子, GPT-4 將“貓王”埃爾維斯?普雷斯利(Elvis Presley)描述為 "一個演員的兒子",但事實(shí)是他的父母都不是演員。
當(dāng)被問及如何比較 GPT-4 和 GPT-3 時(shí),格雷格?布羅克曼說了一個詞:與眾不同。他解釋到:“盡管 GPT-4 還存在很多問題和錯誤,但絕對與眾不同,你可以看到其在微積分或法律等技能方面的提升。雖然它曾在某些領(lǐng)域表現(xiàn)很糟糕,但現(xiàn)在已經(jīng)達(dá)到超越常人的水準(zhǔn)?!?/span>
測試結(jié)果驗(yàn)證了格雷格?布羅克曼的觀點(diǎn)。在高考微積分考試中,GPT-4 得了 4 分, GPT-3 得了 1 分,而介于 GPT-3 和 GPT-4 之間的中間模型 GPT-3.5,得了 4 分。
在分析 GPT-4 的能力時(shí),OpenAI 還讓該模型參加了統(tǒng)一律師考試、法學(xué)院入學(xué)考試(LSAT)、研究生入學(xué)考試(GRE)的定量、口頭推理、分析寫作考試以及和各種 AP 科目考試等測試。結(jié)果顯示,GPT-4 在大多數(shù)這些專業(yè)和學(xué)術(shù)考試中表現(xiàn)與人類水平相當(dāng)。這意味著,如果 GPT-4 是一個僅憑應(yīng)試能力來判斷的人,它可以進(jìn)入法學(xué)院,而且很可能也能進(jìn)入許多大學(xué)。
這是因?yàn)?GPT-4 是在圖像和文本數(shù)據(jù)上訓(xùn)練的,而它的前身只在文本上訓(xùn)練。OpenAI 說,訓(xùn)練數(shù)據(jù)來自 "各種合法授權(quán)的、公開可用的數(shù)據(jù)源,其中可能包括公開可用的個人信息",但當(dāng)被問具體細(xì)節(jié)時(shí),格雷格?布羅克曼避而不談。(訓(xùn)練數(shù)據(jù)曾使 OpenAI 陷入法律糾紛)。
超強(qiáng)優(yōu)勢:圖像理解能力
GPT-4 有超強(qiáng)的圖像理解能力。例如,輸入提示“這張圖片有什么好笑的?GPT-4 會將整張圖片分解,并正確地解釋了這個笑話的笑點(diǎn)。
OpenAI 在其文本到圖像轉(zhuǎn)換系統(tǒng) Dall-E 2 上也遇到了類似倫理困境。在最初禁用該功能后,OpenAI 允許客戶上傳人臉,用 AI 驅(qū)動的圖像生成系統(tǒng)對其進(jìn)行編輯。當(dāng)時(shí),OpenAI 聲稱,其安全系統(tǒng)的升級使面部編輯功能成為可能,因?yàn)樗鼘⑸疃仍旒僖约霸噲D創(chuàng)建性、政治和暴力內(nèi)容的潛在危害降到最低。
另一個長期問題是防止 GPT-4 在無意中被用于可能造成傷害的方式使用。在該模型發(fā)布幾小時(shí)后,以色列網(wǎng)絡(luò)安全初創(chuàng)公司 Adversa AI 發(fā)布了一篇博客,演示了繞過 OpenAI 的內(nèi)容過濾器并讓 GPT-4 生成釣魚電子郵件、對同性戀者的攻擊性描述以及其他令人反感文本的方法。
在語言模型領(lǐng)域,這并不罕見。Facebook 母公司 Meta 的聊天機(jī)器人 BlenderBot 和 OpenAI 的 ChatGPT 也曾被誘惑輸出不恰當(dāng)?shù)膬?nèi)容,甚至透露了其內(nèi)部工作的敏感細(xì)節(jié)。但包括記者在內(nèi)的許多人都希望,GPT-4 可能會在這方面帶來重大改進(jìn)。
當(dāng)被問及 GPT-4 的穩(wěn)健性時(shí),布羅克曼強(qiáng)調(diào),該模型已經(jīng)通過六個月的安全培訓(xùn)。在內(nèi)部測試中,與 GPT-3.5 相比,它對 OpenAI 的使用政策不允許的內(nèi)容請求的回應(yīng)率降低了 82%,對 "事實(shí) "的回應(yīng)率提高了 40% 。
布羅克曼說:"我們花了很多時(shí)間試圖了解 GPT-4 的能力,我們不斷地進(jìn)行更新,包括不斷改進(jìn),這樣模型就更有擴(kuò)展性,以達(dá)到人們希望它擁有的任何個性或模式。"
不足之處
坦率地說,早期的現(xiàn)實(shí)測試結(jié)果并不是那么讓人滿意。除了 Adversa AI 測試之外,微軟的聊天機(jī)器人 Bing Chat 也被證明非常容易受到越獄影響。使用精心設(shè)計(jì)的輸入,用戶能夠讓該聊天機(jī)器人表達(dá)愛意,發(fā)出威脅傷害,為大屠殺辯護(hù)和編造陰謀論。
布羅克曼并不否認(rèn) GPT-4 在這方面的不足,但他強(qiáng)調(diào)了該模型的緩解性轉(zhuǎn)向工具,包括被稱為“系統(tǒng)”消息的 API 級功能。系統(tǒng)消息本質(zhì)上是為 GPT-4 的交互設(shè)定基調(diào)并建立界限的指令。例如,一條系統(tǒng)消息可能是這樣寫的:“你是一位總是以蘇格拉底風(fēng)格回答問題的導(dǎo)師。你永遠(yuǎn)不會給學(xué)生答案,而是總是試著提出正確的問題,幫助他們學(xué)會獨(dú)立思考?!?/span>
我們的想法是,系統(tǒng)消息充當(dāng)護(hù)欄,防止 GPT-4 偏離軌道。布羅克曼說:“真正弄清楚 GPT-4 的語氣、風(fēng)格和本質(zhì)一直是我們關(guān)注的焦點(diǎn)。我認(rèn)為我們開始更多地了解如何進(jìn)行工程設(shè)計(jì),了解如何擁有一個可重復(fù)的過程,讓你得到對人們真正有用的可預(yù)測結(jié)果?!?/span>
布羅克曼還提到了 Evals,這是 OpenAI 最新的開源軟件框架,用于評估其 AI 模型的性能,這是 OpenAI 致力于“增強(qiáng)”其模型的一個標(biāo)志。Evals 允許用戶開發(fā)和運(yùn)行評估 GPT-4 等模型 的基準(zhǔn)測試,同時(shí)檢查其性能,這是一種眾包的模型測試方法。
布羅克曼說:“通過 Evals,我們可以更好地看到用戶關(guān)心的用例,并可以對其進(jìn)行測試。我們之所以開源這個框架原因之一是我們不再每隔三個月發(fā)布一個新模型以不斷改進(jìn)。你不會制造你不能測量的東西,對吧?當(dāng)我們推出新版模型,我們至少可以知道發(fā)生了哪些變化?!?/span>
布羅克曼還被問道,OpenAI 是否會補(bǔ)償人們用 Evals 測試其模型?他不肯承諾,但他確實(shí)指出,在有限的時(shí)間內(nèi),OpenAI 允許選定的 Eevals 用戶提前訪問 GPT-4 API。
關(guān)于未來:GPT-4 的另一個版本
布羅克曼的談話還談到了 GPT-4 的上下文窗口,指的是模型在生成其他文本之前可以考慮的文本。OpenAI 正在測試 GPT-4 的另一個版本,它可以 "記住 "大約 50 頁的內(nèi)容,是普通的 GPT-4 所能容納內(nèi)容的 5 倍,是 GPT-3 的八倍。
布羅克曼認(rèn)為,擴(kuò)大的上下文窗口會帶來新的、以前沒有探索過的應(yīng)用,特別是在企業(yè)中。他設(shè)想了一個為公司打造的 AI 聊天機(jī)器人,利用來自不同來源的各部門的員工的背景和知識,以一種非常明智但具有對話性的方式回答問題。
這不是一個新概念。但布羅克曼提出的理由是,GPT-4 的答案將比今天的聊天機(jī)器人和搜索引擎的答案有用得多。他說:“以前,模型根本不知道你是誰,你對什么感興趣等。而有了更大的上下文窗口肯定會讓它的能力變強(qiáng),從而更好的為人們提供服務(wù)支持。”
? 微軟 Office 全家桶被 GPT-4 革新:Word 一鍵變成 PPT,打工人的春天來了!
? 文心一言來了!李彥宏:百度是全球大廠中第一個做出來的!
?Google 工程主管:AIGC 將在三年內(nèi)終結(jié)編程!
責(zé)任編輯:Rex_17