自從去年11月由OpenAI公司推出的聊天機器人ChatGPT面世以來,在人們驚嘆于其信息搜索和文本生成能力的同時,關于其背后知識產權的質疑聲也隨之而來。
國際知名語言學家喬姆斯基此前曾公開發聲表示,ChatGPT是一個高科技剽竊系統,從海量數據中發現規律,并依照規則將數據串聯在一起,形成像人寫的文章和內容。對于這說法,也有反對者提出,人類的學習也是從現有知識中進行繼承、分析然后規律化的過程,其真正威脅是讓人類不去思考。
人工智能創作作品是否涉嫌剽竊?其生成內容是否受到版權保護?是否存在法律風險?ChatGPT的火爆將這些問題推進人們的視野。
【資料圖】
AIGC是否存在侵權風險
作為一個自然語言處理系統,ChatGPT通過大量文本語料庫進行訓練,然后根據它所學到的內容來回答問題或生成文本,其學習的能力很大程度上依賴于海量數據。
OpenAI在2020年5月發表的名為《Language Models Are Few-Shot Learners》的論文顯示,該公司主要使用來自CommonCrawl、WebText、維基百科和書籍語料庫進行訓練。
使用這些數據是否存在侵權風險?中國信通院云計算與大數據研究所所長何寶宏認為,沒有約束地使用ChatGPT可能會引發知識產權的糾紛?!癈hatGPT的開發者沒有公開生成合成的運行機制以及訓練數據的來源,在用戶引導問答的過程中,ChatGPT的回答缺失對于來源的引用,這樣有可能在用戶未注明來源對生成內容進行使用時造成剽竊。”
北京盈科(杭州)律師事務所律師方超強則表示,AI訓練過程中不可避免地會涉及對他人享有著作權的作品進行復制使用,存在一定著作權侵權的風險?!爱斎贿@一風險也可以進行規避,例如使用不享有著作權的公開作品資源,或者經過授權的文字作品?!?/p>
他還指出,如果AI生產的文字作品與已存在的文字作品構成實質性相似,那么其創作或者后續對AI文字作品的使用,都會有侵害已存在文字作品的風險。
公開報道顯示,目前已有國外新聞媒體指責OpenAI在不支付任何費用的情況下使用他們的文章來訓練ChatGPT。
此前,《華爾街日報》記者Francesco Marconi在網上公開表示,他向ChatGPT索取了一份用來訓練它的新聞來源清單,收到的回復列出了包括路透社、《紐約時報》、《衛報》、BBC新聞等20家媒體,但并不清楚OpenAI是否與所列出版商都達成了協議。
全球最大的媒體集團之一新聞集團(News Corp.)旗下道瓊斯公司的法律總顧問Jason Conti日前也在提供給媒體的一份聲明中稱,任何想使用《華爾街日報》記者的作品來訓練人工智能的人,都應該從道瓊斯獲得適當的授權,但“道瓊斯沒有與OpenAI達成相關的協議”。他表示,道瓊斯公司正在對該情況進行審查,并將嚴肅對待濫用記者作品的行為。
在北京大成律師事務所合伙人肖颯看來,這其實涉及“文本數據挖掘”是否需要相應的知識產權授權的問題。ChatGPT需要對語料庫中的數據進行挖掘和訓練,將語料庫中的內容復制到自己的數據庫中,相應的行為通常在自然語言處理領域被稱為“文本數據挖掘”?!爱斚鄳奈谋緮祿赡軜嫵勺髌返那疤嵯拢谋緮祿诰蛐袨槭欠袂址浮畯椭茩唷斍叭源嬖跔幾h?!毙わS說。
她指出,在比較法領域,日本和歐盟在其著作權立法中均對合理使用的范圍進行了擴大,將AI中的“文本數據挖掘”增列為一項新的合理使用的情形。“目前我國著作權法依舊保持了合理使用制度的封閉式規定,僅著作權法第二十四條規定的十三種情形可以被認定為合理使用,也就是說,目前我國著作權法并未將AI中的‘文本數據挖掘’納入到合理適用的范圍內,文本數據挖掘在我國依然需要相應的知識產權授權?!?/p>
AIGC可以受到版權保護嗎
公開報道顯示,ChatGPT可以編寫代碼、撰寫詩歌,甚至還能通過一定提示完成短篇小說的寫作,令人不禁提出疑問:AIGC是否屬于創作?人工智能能替代人類作者嗎?
人工智能研究專家田濤源對中青報·中青網記者表示,目前ChatGPT本質上還是在做詞條的排列組合,會根據人類表達的需求給出最接近人類喜好的答案?!爱斔牧Χ鹊竭_‘詞’這個級別的時候會給人感覺好像是在創作,但實際上它無法跳出訓練文本庫的歸納范圍,即無法創造人類不知道的新知識?!?/p>
方超強也指出,AI創作在本質上,是人類創作的衍生;需要明確的是,是人類設計了程序,訓練了程序,進而達到AI軟件能夠相對智能地輸出一些符合人類要求的作品。歸根結底,本質上還是人在主導。
事實上,當被問及“你生成的內容是作品嗎”,ChatGPT也承認,“我可以根據輸入的提示來生成文本,但是這些生成的文本并不算是作品,因為它們并沒有蘊含創造性、獨創性、藝術性等元素,僅僅是根據預先訓練好的模型對輸入的提示進行生成而已。因此,我生成的內容更類似于工具或輔助工具,可以幫助人們自動生成一些文本,但是它們不算是創意作品或原創作品?!?/p>
此前,已有多篇學術論文將ChatGPT列為作者。據《自然》網站報道,至少有4份已發表和預印本上的論文使用了ChatGPT作為論文的“合著者”。
針對這種情況,日前已有多家學術期刊發表聲明,完全禁止或嚴格限制使用ChatGPT等人工智能機器人撰寫學術論文?!犊茖W》雜志表示不接受使用ChatGPT生成的投稿論文,同時不允許ChatGPT作為論文合著者?!都毎泛汀读~刀》則表示論文作者不能使用人工智能工具取代自己完成關鍵性任務,作者還必須在論文中詳細解釋他們是如何使用這些人工智能工具的。
北京云嘉律師事務所副主任、中國政法大學知識產權研究中心特約研究員趙占領在接受中青報·中青網記者采訪時表示,按照目前絕大部分國家的著作權法,使用人工智能軟件產生的內容不屬于法律意義上的作品,人工智能軟件本身不能視為法律意義上的作者,使用者也并非著作權人。
“但從商業角度而言,AI智能公司花了大量金錢和技術資本打造了高度智能的AI程序,對該程序衍生的‘作品’完全不予保護,也有違公平?!狈匠瑥娭赋?,此前國內司法實踐中,對于字庫軟件生成的具有獨創性和藝術美感的“字體”給予著作權保護,也是對AI作品進行保護的一種體現。他認為,如何對現有知識產權理論和法律體系進行調整,為AI文本或其他AI作品,包括AI美術作品、音樂作品等,提供合理且必要的權利保護體系,已經是目前較為迫切的命題。
“個人認為,對于具有獨創性兼具一定藝術高度的AIGC作品,應當受到知識產權的保護,反之則不予保護;相應的知識產權權屬應當歸屬于AI公司;至于這一類的AIGC作品保護、使用規則,是否需要比對人類創作作品進行縮減或限制,仍有待進一步的探討。”方超強還建議,“應對AIGC內容進行有限度的保護,如果不加以限制,未來可能會出現AI公司手握‘創作霸權’的局面,影響甚至抑制人類創作者的創作熱情,長遠來說,會影響人類的知識產權創作。”
但就目前ChatGPT的表現來看,它的“創作”所體現出來的觀點通常并不鮮明,更缺乏原創性,表達方式雖未必與其他人作品構成實質相似,但也經常借鑒一個或多個主體的表達方式。目前也只能在部分領域、部分方面替代人類的工作。但也帶來一定的弊端,容易給某些群體帶來思維惰性,在一定程度上可能反而抑制了創新。
(應受訪者要求,田濤源為化名)
中青報·中青網見習記者 李若一 記者 王林 見習記者 賈驥業 來源:中國青年報
責任編輯:Rex_21