AI著作權之法律問題解析-AI著作的重製及合理使用(四)
AI機器學習從訓練資料數據集Dataset開始,至AI產出的output,所有過程舉凡:資料數據集的重製、中間步驟的重製、模型的非文義性重製,皆有重製行為,是否構成侵權?
此時,合理使用(Fair Use)原則的轉化性因素(Transformative Factor)在AI機器學習方面應如何調整適用?
就此,涉及AI從學習到著作的生產過程(包括利用他人著作訓練AI的情形)是否有侵害他人著作權之議題。
以微軟AI小冰創作的現代詩為例,其運作主要是將大量的現代詩資料輸入進小冰的資料庫中,透過大數據的資料探勘,分析每個字的前、後最常出現的關聯字。以目前AI最核心的主流技術-深度學習,有賴於大量經過結構化、適當標記的「資料」進行訓練,雖模擬成人類透過「閱讀」來學習,但將大量的現代詩「資料」輸入進小冰的資料庫中,這些現代詩作為受著作權法保護的「語文著作」,實際上已被「重製」在小冰的資料庫裡,而其作用可能單純作為訓練AI使用,亦可能之後會作為小冰組成的一部分而對外提供服務,此時也可能涉及「改作」或「公開傳輸」的利用行為,吾人即必須認知這些可能涉及AI著作權的法律風險或相關問題。
由技術的角度來看,以上開深度學習的方式訓練如微軟小冰這樣的AI,絕對涉及著作的重製,如不符合著作財產權限制(合理使用)的規定,即可能構成侵權;然而,「訓練」AI的過程與一般著作利用不同,著作經濟利益的保護,過去主要因其具有欣賞、娛樂或實用的功能而被保護,以確保足夠的經濟誘因,但AI至少在訓練的時候,似乎並沒有實際「影響」到前述欣賞、娛樂或實用的經濟利益,而是要使微軟的AI演算法得以「掌握」中文字所相關的「主題」、「前、後字元關聯程度」,進而可以對外提供服務。如果單純為訓練之目的,將大量的現代詩輸入資料庫,會如同搜尋引擎大量下載、檢索網路資料一樣,是否也會被認定為「合理使用」嗎?
若沒有明確的答案,就可能對於企業投入研發或創造此類AI應用產生法律爭議。
首先,必須瞭解何謂合理使用。所謂合理使用(Fair Use),是指著作權法為調和私益與公益,在某些情形下,規定為達到公共利益之目的,得不需要取得著作權人的授權,而直接使用。
我國著作權法第65條第1項規定:著作之合理使用,不構成著作財產權之侵害第65條第2項規定四個判斷標準:「利用之目的及性質」、「著作之性質」、「所利用的質量及其在整個著作之中所佔的比例」、「使用結果對著作潛在市場與現在價值之影響」。
美國最高法院於1994年的Campbell案(Campbell v. Acuff-Rose Music, Inc. 510 U.S. 569, 579)指出,這四個因素必須獨力判斷,且沒有任何一個因素是決定性因素,最後再綜合考量是否構成合理使用;且提出轉化性利用的概念。因此,每一個判決中都會詳細論述這四個因素。如果是商業性使用,但有投入新的創意元素進去,在美國稱之為「具有轉化性價值(transformative value)」者,較易構成合理使用。如果是利用著作開發新市場,由於有較高的轉化性價值,而且市場是新開發的,就不是對既有的著作潛在市場造成傷害,也構成合理使用。
本文經 法律新幹線 & 陳建佑律師事務所 授權轉載,原文在此
作者/陳建佑 律師
編輯/馬克斯