我國(guó)目前的生成式人工智能技術(shù)創(chuàng)新還處在初級(jí)階段,,法律法規(guī)的制定應(yīng)當(dāng)給科技創(chuàng)新留有一定的發(fā)展空間,,對(duì)產(chǎn)品在研發(fā)階段的數(shù)據(jù)合法性要求,應(yīng)當(dāng)根據(jù)數(shù)據(jù)類型和基本倫理要求,,采取開放包容的規(guī)范原則,。解決生成式人工智能所涉及的知識(shí)產(chǎn)權(quán)難題,,需要使用多種制度工具,建立多元化解決機(jī)制,,打造一套綜合性解決方案,。
生成式人工智能數(shù)據(jù)合法性成為焦點(diǎn)問(wèn)題
近期國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》(下稱《辦法》)第七條規(guī)定:“生成式人工智能服務(wù)提供者應(yīng)當(dāng)依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動(dòng),,使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型,;不得侵害他人依法享有的知識(shí)產(chǎn)權(quán);涉及個(gè)人信息的,,應(yīng)當(dāng)取得個(gè)人同意或者符合法律,、行政法規(guī)規(guī)定的其他情形;……”該條款的主要目的是規(guī)范生成式人工智能服務(wù)提供者數(shù)據(jù)來(lái)源的合法性問(wèn)題,,這也是當(dāng)前全球范圍內(nèi)生成式人工智能數(shù)據(jù)合法性的焦點(diǎn)問(wèn)題,。
人工智能的發(fā)展,與知識(shí)產(chǎn)權(quán)發(fā)生著緊密的關(guān)系,。圖為今年上海舉行的世界人工智能大會(huì)中主題為“交響”的AIGC藝術(shù)展,。資料照片
數(shù)據(jù)來(lái)源合法性是生成式人工智能產(chǎn)品合規(guī)的必要條件,若數(shù)據(jù)來(lái)源不合法不合規(guī),,該產(chǎn)品將無(wú)法進(jìn)入市場(chǎng)應(yīng)用階段,。但是,如果在生成式人工智能研發(fā)階段就嚴(yán)格執(zhí)行合法性標(biāo)準(zhǔn),,就會(huì)限制大數(shù)據(jù)的廣泛采集,,阻礙研發(fā)進(jìn)程,影響高品質(zhì),、高智能產(chǎn)品的誕生,。所以,《辦法》第三條也提出了“堅(jiān)持發(fā)展和安全并重、促進(jìn)創(chuàng)新和依法治理相結(jié)合的原則,,采取有效措施鼓勵(lì)生成式人工智能創(chuàng)新發(fā)展,,對(duì)生成式人工智能服務(wù)實(shí)行包容審慎和分類分級(jí)監(jiān)管”的基本原則。
我國(guó)要在生成式人工智能這一領(lǐng)域有所突破創(chuàng)新,,一定要有相對(duì)寬松的法律政策環(huán)境和技術(shù)生態(tài)建設(shè),,吸取傳統(tǒng)信息產(chǎn)業(yè)領(lǐng)域軟件和芯片技術(shù)“受制于人”窘境的教訓(xùn),利用我國(guó)獨(dú)有的數(shù)據(jù)紅利以及政策環(huán)境,,快速形成自主可控的生成式人工智能基礎(chǔ)技術(shù)體系,。
生成式人工智能所涉及的知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)
生成式人工智能數(shù)據(jù)訓(xùn)練的需求,體現(xiàn)在數(shù)據(jù)數(shù)量,、多樣性、質(zhì)量,、領(lǐng)域特定性,、多模態(tài)性、實(shí)時(shí)性,、長(zhǎng)期演進(jìn)性,、平衡性、合規(guī)性以及多語(yǔ)言性等方面,。滿足這些需求,,可以幫助生成式人工智能模型更好地適應(yīng)各種場(chǎng)景和任務(wù),提高其性能和可應(yīng)用性,。
生成式人工智能的數(shù)據(jù)來(lái)源合法性,,主要是指生成式人工智能收集的數(shù)據(jù)是否以合法、正當(dāng)?shù)姆绞饺〉?,是否無(wú)損數(shù)據(jù)權(quán)益人的權(quán)益,,是否取得相關(guān)知識(shí)產(chǎn)權(quán)所有者的同意,在處理個(gè)人信息時(shí)是否取得了個(gè)人信息主體或其他數(shù)據(jù)權(quán)利人的同意等,。
生成式人工智能的數(shù)據(jù)來(lái)源主要分為兩個(gè)部分:第一部分為生成式人工智能的訓(xùn)練數(shù)據(jù)庫(kù),,內(nèi)容幾乎涵蓋所有能收集到的人類數(shù)字化信息,包括公共數(shù)據(jù),、網(wǎng)絡(luò)信息(文本,、圖片、音視頻),、數(shù)字化圖書,、自媒體對(duì)話數(shù)據(jù)集、報(bào)刊雜志,、科學(xué)論文等,;第二部分為生成式人工智能在服務(wù)用戶的過(guò)程中所收集和輸出的信息,也就是人工智能合成數(shù)據(jù)。第一部分的數(shù)據(jù)收集往往可能遭遇知識(shí)產(chǎn)權(quán)瓶頸,;第二部分的數(shù)據(jù)收集的傳統(tǒng)知識(shí)產(chǎn)權(quán)風(fēng)險(xiǎn)較少,。
數(shù)據(jù)庫(kù)訓(xùn)練的不同來(lái)源有不同的知識(shí)產(chǎn)權(quán)法律風(fēng)險(xiǎn),可歸納為以下三個(gè)方面:一是來(lái)自于公有領(lǐng)域的內(nèi)容,,本身已經(jīng)不存在著作權(quán)財(cái)產(chǎn)權(quán)保護(hù)問(wèn)題,,但會(huì)涉及署名權(quán)、修改權(quán)等人身權(quán)問(wèn)題,;二是通過(guò)與著作權(quán)人一對(duì)一簽訂授權(quán)協(xié)議或者通過(guò)著作權(quán)集體管理機(jī)構(gòu)合法授權(quán)獲得的內(nèi)容,,但這部分內(nèi)容通常也難以做到百分百的準(zhǔn)確授權(quán);三是利用“爬蟲”技術(shù)爬取的網(wǎng)絡(luò)信息,,這也是生成式人工智能技術(shù)最常用的數(shù)據(jù)收集手段,,其爬取的內(nèi)容受網(wǎng)絡(luò)爬蟲協(xié)議條款約束,應(yīng)視其具體使用目的和對(duì)象判斷是否合法,,若出于商業(yè)產(chǎn)品開發(fā)使用目的,,一般會(huì)受到限制。
在訓(xùn)練數(shù)據(jù)庫(kù)的輸入階段和輸出階段,,最大的著作權(quán)侵權(quán)風(fēng)險(xiǎn)是侵犯復(fù)制權(quán)和改編權(quán),。在輸入階段,如果將大量受著作權(quán)保護(hù)的作品用來(lái)訓(xùn)練人工智能,,這本身看似出于學(xué)習(xí)目的,,實(shí)則最終服務(wù)于商業(yè)目的,很難使用現(xiàn)有的著作權(quán)合理使用制度規(guī)避侵權(quán)責(zé)任,。在輸出階段,,如果生成的內(nèi)容與原作品在表達(dá)上構(gòu)成實(shí)質(zhì)性相似,則可能侵犯復(fù)制權(quán),;如果在保留原作品表達(dá)的基礎(chǔ)上形成了新的表達(dá),,則可能涉及改編權(quán)問(wèn)題。
美國(guó)對(duì)人工智能研發(fā)過(guò)程中的知識(shí)產(chǎn)權(quán)問(wèn)題,,目前采取相對(duì)統(tǒng)一的價(jià)值指導(dǎo)和原則性規(guī)定予以處理,,尚未出臺(tái)具體規(guī)范。出于推動(dòng)人工智能創(chuàng)新,、審慎立法,、防止法律與技術(shù)進(jìn)步脫節(jié)等考量,美國(guó)對(duì)人工智能的規(guī)制采取“先產(chǎn)業(yè)發(fā)展后立法”模式,,即在AI研發(fā)過(guò)程中不提及版權(quán),,而是依賴于社會(huì)輿論、企業(yè)自覺(jué),、司法和行政系統(tǒng)的事后回應(yīng)來(lái)解決知識(shí)產(chǎn)權(quán)爭(zhēng)議,。2023年7月,,美國(guó)七大AI企業(yè)與拜登政府簽署協(xié)議,承諾采取自愿監(jiān)管措施管理AI技術(shù)開發(fā)的法律風(fēng)險(xiǎn),,包括展開安全測(cè)試,、為AI生成內(nèi)容添加數(shù)字水印、制定透明的隱私與知識(shí)產(chǎn)權(quán)保護(hù)政策等,。
多元化解決生成式人工智能的知識(shí)產(chǎn)權(quán)難題
解決生成式人工智能所涉及的知識(shí)產(chǎn)權(quán)難題,,需要使用多種制度工具,建立多元化解決機(jī)制,,打造一套綜合性解決方案,。
借用早期互聯(lián)網(wǎng)治理規(guī)則
生成式人工智能的發(fā)展可類比互聯(lián)網(wǎng)治理,引入類似合理使用原則,、避風(fēng)港機(jī)制等規(guī)則,。
合理使用原則:擴(kuò)展著作權(quán)法中的合理使用原則,明確生成式人工智能在數(shù)據(jù)訓(xùn)練和輸出過(guò)程中的合理使用標(biāo)準(zhǔn),。鼓勵(lì)A(yù)I開發(fā)者在使用受版權(quán)保護(hù)的數(shù)據(jù)時(shí),,使其行為符合合理使用的要求,如非商業(yè)性用途,、適度復(fù)制、不侵犯原作品的市場(chǎng)價(jià)值等,。美國(guó)《版權(quán)法》采用“四要素分析法”來(lái)判斷合理使用,,把人工智能使用作品解釋為訓(xùn)練數(shù)據(jù)的“轉(zhuǎn)換性使用”,美國(guó)的司法實(shí)踐已經(jīng)作了探討,。我國(guó)《著作權(quán)法》規(guī)定了“個(gè)人使用”,、“適當(dāng)引用”和“科學(xué)研究”等合理使用情形,但目前生成式人工智能的商業(yè)性應(yīng)用難以符合這些規(guī)定,。此外,,還可適當(dāng)擴(kuò)展爬蟲技術(shù)使用的合理性,特別是對(duì)公開的網(wǎng)絡(luò)信息內(nèi)容,,只要其屬于通過(guò)搜索爬蟲,、在遵守爬蟲協(xié)議的前提下獲取的數(shù)據(jù),則均可視為來(lái)源合法的數(shù)據(jù),。在這個(gè)過(guò)程中,,爬蟲技術(shù)無(wú)法識(shí)別被抓取內(nèi)容的著作權(quán)問(wèn)題,事實(shí)上,,爬蟲海量抓取時(shí)也無(wú)法逐一獲得版權(quán)授權(quán)(類似搜索引擎),。如果事后有權(quán)利人主張權(quán)利,可再根據(jù)具體情景判定善意侵權(quán)責(zé)任,。
避風(fēng)港機(jī)制:避風(fēng)港機(jī)制建立在網(wǎng)絡(luò)服務(wù)提供商和內(nèi)容平臺(tái)與用戶之間共同承擔(dān)責(zé)任的基礎(chǔ)上,。類比到生成式人工智能領(lǐng)域,,可以探索建立AI開發(fā)者與用戶之間的責(zé)任分擔(dān)機(jī)制。避風(fēng)港機(jī)制要求網(wǎng)絡(luò)服務(wù)提供商和內(nèi)容平臺(tái)主動(dòng)采取措施來(lái)監(jiān)測(cè)和清除違法內(nèi)容,。在生成式人工智能的發(fā)展中,,開發(fā)者應(yīng)當(dāng)建立有效的自我監(jiān)管機(jī)制,定期自查模型的輸出內(nèi)容,,以確保符合合規(guī)要求,。類似避風(fēng)港的投訴處理機(jī)制也可以在生成式人工智能的領(lǐng)域內(nèi)建立。允許用戶和權(quán)利人向AI開發(fā)者提出投訴,,并及時(shí)處理和回應(yīng)投訴,,有助于解決潛在的違法和侵權(quán)問(wèn)題。避風(fēng)港機(jī)制還要求網(wǎng)絡(luò)服務(wù)提供商和內(nèi)容平臺(tái)公布其對(duì)違法內(nèi)容的審核標(biāo)準(zhǔn)和處理措施,。在生成式人工智能的發(fā)展中,,開發(fā)者應(yīng)當(dāng)公開透明地向用戶和社會(huì)說(shuō)明模型輸出內(nèi)容的規(guī)范和審核機(jī)制。
通過(guò)集體管理組織解決授權(quán)難題
著作權(quán)集體管理是目前法律框架下解決大量權(quán)利許可的一種比較可行的辦法,,也是國(guó)際通行的做法,。我國(guó)目前已有音樂(lè)、音像,、文字,、攝影和電影五個(gè)著作權(quán)集體管理組織。人工智能研發(fā)機(jī)構(gòu)可以通過(guò)這些著作權(quán)集體管理組織對(duì)特定作品進(jìn)行著作權(quán)集體授權(quán),。我國(guó)《著作權(quán)集體管理?xiàng)l例(修訂草案征求意見(jiàn)稿)》第四條也有提及,。
在生成式人工智能訓(xùn)練數(shù)據(jù)的著作權(quán)授權(quán)過(guò)程中,AI開發(fā)者可以通過(guò)著作權(quán)集體管理組織獲得某一領(lǐng)域的作品授權(quán),,充分發(fā)揮著作權(quán)集體管理的保障效能,,減少開發(fā)者的數(shù)據(jù)合法性風(fēng)險(xiǎn)。即使在無(wú)法判斷某一作品權(quán)利人是否系著作權(quán)集體管理組織會(huì)員的情況下,,也可以通過(guò)延展代理機(jī)制保證權(quán)利人的獲酬機(jī)會(huì),,表達(dá)人工智能服務(wù)提供者尊重著作權(quán)的善意。
利用開放授權(quán)的數(shù)據(jù)資源
開放授權(quán)機(jī)制源于計(jì)算機(jī)軟件領(lǐng)域的開源許可證,,是一種對(duì)世的著作權(quán)開放授權(quán)聲明,,通過(guò)許可證約定使用者的權(quán)利和義務(wù),目的是打破一對(duì)一的低效授權(quán),。在遵循許可證條件的情況下,,使用者可以自由、免費(fèi)地使用和修改作品,。這種開放授權(quán)機(jī)制后來(lái)擴(kuò)展到文檔,、圖片、音視頻領(lǐng)域,。知識(shí)共享許可協(xié)議(Creative Commons license,,簡(jiǎn)稱CC協(xié)議)為傳統(tǒng)作品的版權(quán)授權(quán)開辟了一條新路,。
開放授權(quán)的共同點(diǎn)是:承認(rèn)著作權(quán),要求署上原作者或著作權(quán)持有人的姓名,,這是授權(quán)最基本的限制,;允許免費(fèi)的私人使用和商業(yè)使用;允許使用者修改及修改后再發(fā)布,;免責(zé)聲明:原作者或著作權(quán)持有人不承擔(dān)作品使用后的風(fēng)險(xiǎn)及產(chǎn)生的后果,;終止授權(quán):一旦違反開放授權(quán)條件時(shí),終止一切授權(quán),,回歸傳統(tǒng)的知識(shí)產(chǎn)權(quán)保護(hù),。
以主流的深度學(xué)習(xí)框架為例,目前,,人工智能軟件技術(shù)開發(fā)都使用開源許可證,,主要有MIT許可證、BSD許可證,、Apache許可證等,。訓(xùn)練數(shù)據(jù)庫(kù)也應(yīng)多使用開源資源,并推動(dòng)更多科學(xué)作品的開放授權(quán),,推動(dòng)生成式人工智能輸出數(shù)據(jù)的開放許可,。
利益平衡是我國(guó)知識(shí)產(chǎn)權(quán)法律體系的一項(xiàng)重要原則。人工智能訓(xùn)練數(shù)據(jù)合法性問(wèn)題,,本質(zhì)上是個(gè)人利益與公共利益沖突的體現(xiàn),。如果缺少利益平衡原則,在利益分成時(shí)容易產(chǎn)生分歧,。在公共利益方面,公眾受益于智能科技產(chǎn)品服務(wù),,由此享受到整體社會(huì)福祉的提升,。同時(shí),得益于傳統(tǒng)知識(shí)產(chǎn)權(quán)體系的保障,,創(chuàng)作者能夠獲得足夠的法律保護(hù),,其知識(shí)產(chǎn)權(quán)價(jià)值能夠保持長(zhǎng)期穩(wěn)定,知識(shí)產(chǎn)權(quán)成果能夠在市場(chǎng)流通賦值,。當(dāng)人工智能時(shí)代到來(lái),,傳統(tǒng)的知識(shí)產(chǎn)權(quán)規(guī)則再一次遇到挑戰(zhàn),必須隨著利益再平衡的需求進(jìn)行調(diào)整,。唯有如此,,才能實(shí)現(xiàn)《辦法》的發(fā)展目標(biāo),推動(dòng)人機(jī)良性互動(dòng)的社會(huì)發(fā)展,。
?。ㄗ髡邽楸本┐髮W(xué)法學(xué)院教授)
?
近年來(lái),,城投領(lǐng)域腐敗案件多發(fā),,涉及省市縣多層級(jí)。省級(jí)層面,,云南省建設(shè)投資控股集團(tuán)有限公司副總經(jīng)理王崢被查,。
上海數(shù)據(jù)集團(tuán)是我國(guó)省級(jí)層面首家以數(shù)據(jù)為核心業(yè)務(wù)的地方國(guó)企,承擔(dān)了上海市公共數(shù)據(jù)和國(guó)企數(shù)據(jù)的授權(quán)運(yùn)營(yíng)職能,。
經(jīng)濟(jì)參考報(bào)社版權(quán)所有 本站所有新聞內(nèi)容未經(jīng)經(jīng)濟(jì)參考報(bào)協(xié)議授權(quán),,禁止轉(zhuǎn)載使用
新聞線索提供熱線:010-63074375 63072334 報(bào)社地址:北京市宣武門西大街57號(hào)
JJCKB.CN 京ICP備18039543號(hào)