機器之心報道
編輯:小舟
OpenAI:發現模型漏洞,找我領獎。
距離 ChatGPT 發布已過去 4 個月,GPT-4 也發布近一個月。OpenAI 的這兩大模型徹底改變了自然語言處理(NLP)領域的格局,甚至為實現通用人工智能(AGI)帶來了新的可能。
(相關資料圖)
幾個月來,人們在感慨類 ChatGPT 模型強大能力的同時,也發現這些模型存在很多問題。其中,最嚴重的問題之一就是模型會生成虛假錯誤的信息,這引起人們的吐槽。好消息是,從現在開始,給模型挑毛病也將獲得一份獎勵。
OpenAI 今天宣布啟動漏洞賞金計劃,以幫助解決大型語言模型(例如 ChatGPT)帶來的日益增長的網絡安全風險。
OpenAI 與眾包網絡安全平臺 Bugcrowd 合作,邀請機器學習領域所有研究人員報告 OpenAI 的模型系統中存在的 bug(漏洞)。OpenAI 會給予報告漏洞的人 200 - 20000 美元不等的獎金,具體取決于漏洞的嚴重程度。
漏洞報告平臺:
https://bugcrowd.com/openai
OpenAI 表示他們的使命是創建造福人類的 AI 系統,也因此大力投資于研究和工程,以確保其提出的人工智能系統安全可靠。為了進一步解決現有大模型存在的漏洞和缺陷,OpenAI 啟動了這項漏洞賞金計劃,以邀請全球網絡安全研究人員和技術愛好者來識別和解決 OpenAI 的模型系統中存在的漏洞,最終提高系統的安全性。
現實意義
OpenAI 的漏洞賞金計劃能起到多大的實際作用?
根據 AI 網絡安全公司 DarkTrace 的數據,從 1 月到 2 月,基于 AI 的工程攻擊增加了 135%,這與 ChatGPT 的問世有很大關系。因此,盡管這份賞金計劃受到一些技術專家的歡迎,但也有很多人不看好,他們認為該計劃不太可能完全解決日益復雜的 AI 技術帶來的廣泛網絡安全風險。
畢竟,該計劃的范圍僅限于可能直接影響 OpenAI 系統和合作伙伴的漏洞,它似乎無法解決對惡意使用此類技術(如模擬、合成媒體或自動黑客工具)的更廣泛擔憂。
要知道,漏洞賞金計劃是在一系列安全問題的背景下推出的。例如,在發布 3 天后,GPT-4 就為自己制定了外逃計劃,甚至聲稱可以它可以控制計算機,還索要開發文檔和 API。
GPT-4 的這波操作屬實令人有幾分害怕......
上個月,ChatGPT 還因巨大漏洞宕機數個小時,具體原因是部分用戶能看到其他用戶的聊天內容和支付信息。這為 AI 模型的隱私保護再次敲響警鐘。
另一方面,已經有技術研究人員發現 ChatGPT 的 API 可能因濫用造成較大風險。一位安全研究人員曾在推特上分享了自己利用漏洞破解 ChatGPT 的 API 并發現 80 多個秘密插件的經歷。
也許是受到這些問題的沖擊,OpenAI 啟動了這項賞金計劃。但是,OpenAI 在漏洞賞金計劃的官方頁面指出:「與模型 prompt 和響應內容相關的問題嚴格超出范圍,除非它們對范圍內的服務有額外的直接可驗證的安全影響,否則不會得到獎勵。」
從這個角度看,OpenAI 的這份漏洞賞金計劃可能有助于改善其模型自身的安全態勢,但對于解決生成式 AI 和 ChatGPT 等模型給整個社會帶來的安全風險卻無濟于事。
參考鏈接:
https://openai.com/blog/bug-bounty-program
https://venturebeat.com/security/openai-announces-bug-bounty-program-to-address-ai-security-risks/
責任編輯:Rex_12