3 輸入端視角:數據與版權侵權
在本文的上篇中,我們深入探討了AI生成作品著作權保護的「產出面向」,剖析在這個快速演變的領域中,關於擁有權與作者歸屬的複雜議題。現在,我們將焦點轉向問題的「輸入面向」:用於訓練AI模型的大型數據集往往涉及受著作權保護材料的複製。由於專有AI系統的不透明性,許多版權持有者面臨難以確認哪些數據被取用的困境。當前全球多宗訴訟案件更凸顯一個關鍵問題:使用受著作權保護的作品來訓練AI模型,是否必須事先取得版權擁有人的明確授權?
3.1 香港擬引入的版權豁免條款
香港現行的《版權條例》並無針對計算數據分析與處理的版權豁免。因此,涉及AI模型開發與訓練的活動可能面臨版權侵權風險。為此,政府擬引入特定版權豁免,容許合理使用版權作品作電腦數據分析和處理,涵蓋非商業和商業用途(「文本及數據開採豁免」)。
為平衡促進AI技術創新與保護擁有人權益,政府提出多項保障措施:
(a) 合法存取:須合法取用版權作品
(b) 退出機制:如版權擁有人明確表示選擇保留其權利,則相關文本及數據開採活動屬未經授權
(c) 使用限制:不得後續使用基於文本及數據開採豁免所複製的版權作品
(d) 附加條件:規定使用者備存及披露版權作品來源的紀錄、保密數據儲存、限制保存時間/目的等
3.2 創新與版權的平衡
香港的建議框架借鏡歐盟、日本與新加坡做法,這些地區均已建立適用商業與非商業用途的文本及數據開採豁免。尤值關注的是,歐盟的豁免架構賦予擁有人退出權,相較之下,英國則將豁免範圍嚴格限於非商業性研究用途。
儘管英國政府近期曾考慮將文本及數據開採豁免擴展至商業用途,但因版權擁有人反對而撤回提案。關鍵異議在於此類豁免可能產生雙重負面效應:其一將侵蝕擁有人透過授權金獲利的既有商業模式,其二可能顛覆現行文本及數據開採的市場授權機制(如文本及數據開採活動之授權協議)。其咨詢文件指出,透過適當保障版權擁有人的措施可緩解這些潛在弊端,並強調任何文本及數據開採豁免必須在權利保護與產業發展間取得平衡。促進數據開採與分析能讓創作者運用現有作品透過AI產出新穎原創內容,有望推動教育、醫療、娛樂等跨領域創新。
更值得深入探討的是,退出機制的具體實施層面仍存在諸多待解難題。就版權擁有人的角度而言,核心困境體現在兩個維度:其一為權利行使方式的不確定性(究竟應透過締結補充協議或發布單方權利保留聲明);其二為權利主張時效性的模糊(特別是在AI企業已完成模型訓練的既成事實情況下)。而對AI開發商來說,真正的技術挑戰在於如何建立有效的作品過濾系統,確保能精準辨識並篩除已聲明退出文本及數據開採豁免授權範圍的特定權利作品。
4 結論:尋找數位時代的新平衡
經由本系列上下兩篇的分析,我們已深入剖析AI技術發展所衍生的多重法律困境及其對現行版權體系的結構性衝擊。當前擁有人與AI產業間的權益拉鋸雖仍存在顯著張力,但建構具包容性的制度平衡機制,實為調和各方利益、最大化社會創新效益的關鍵所在。就香港的特殊定位而言,實行包含商業用途的廣泛性文本及數據開採豁免,輔以完善的作品來源識別系統與擁有人退出權保留機制,可視為最具實踐智慧的立法方向。
AI與版權法的交匯既帶來挑戰也孕育機遇。透過重新思考現有框架並促進與持份者的實質對話,方能在保障創作權益與促進技術創新之間,開闢出一條兼容並蓄的法治路徑。此種新型態的法律生態系統,不僅應為人類與機器的協同創作預留發展空間,更須確立符合AI時代特徵的權利分配與責任歸屬原則。