隨美國三藩市一位聯邦法官日前裁定,由亞馬遜支持的AI初創公司Anthropic利用圖書訓練其大模型Claude未侵犯作者版權,法官稱之為“合理使用”、“具有高度轉化性”。但法官也表示,盜版作者的書籍是不合理的。
根據美國版權法,Anthropic未經許可使用書籍來訓練其人工智慧大模型是合法的。美國地區法官威廉·阿爾蘇普(William Alsup)寫道,Anthropic的人工智慧訓練並沒有侵犯作者的版權,因為大語言模型 “既未向公眾複製某部作品的創意元素,甚至也未複製某位作者可識別的表達風格”。
法官認為,使用受版權保護的作品來訓練大模型以生成新文本,這一目的和性質從根本上具有轉換性。“就像任何渴望成為作家的讀者一樣,Anthropic的大模型訓練並非為了複製或取代原作,而是為了突破局限、創造新事物”。
圍繞大語言模型中受版權保護作品使用的法律糾紛持續發酵,這一裁定是人工智慧公司的一次重大勝利。阿爾蘇普的裁決為該行業未來的法律界限和發展空間奠定了基礎。Anthropic一位發言人在聲明中表示,該判決符合版權法旨在促進創造力和推動科學進步的宗旨。
這起訴訟由作者安德裏亞·巴茨(Andrea Bartz)、查爾斯·格雷伯(Charles Graeber)和柯克·華萊士·詹森(Kirk Wallace Johnson)去年8月向美國加州北區地方法院提起。訴訟稱,Anthropic通過“竊取數十萬本受版權保護的書籍”建立了“價值數十億美元的業務”。
根據當時的訴狀,這些作者的作品被收錄在Anthropic用來訓練Claude的盜版書籍數據集中。“Anthropic下載了原告作品的已知盜版版本並複製,將這些盜版版本輸入其模型。”該訴訟要求賠償金額不詳的經濟損失,並要求永久阻止Anthropic濫用作者的作品。
部分訴訟焦點圍繞Anthropic盜版並保留的約700萬冊圖書組成的“中央圖書館”。Anthropic最終決定不使用這些盜版材料來訓練其大模型。而法官認為,Anthropic在“中央圖書館”中複製並存儲700多萬冊盜版圖書的行為侵犯了作者版權,不構成合理使用。
法官已下令12月就盜版書籍如何被用於創建Anthropic的中央圖書館進行庭審,以評估由此產生的任何損害賠償。法官寫道,“Anthropic後來購買了此前從互聯網上竊取的書籍副本,這並不能免除其盜竊責任,但可能會影響法定損害賠償的範圍。”
美國版權法規定,故意侵犯版權可按每部作品最高15萬美元的法定賠償標準追責。
來源:中國澎湃新聞