MetaのAIモデル訓練における著作権侵害の疑惑と内部議論の実態

Contents

概要

Meta社の従業員が、著作権で保護された作品を法的に問題のある方法で取得し、AIモデルのトレーニングに使用することを内部で議論していたことが、カリフォルニアの裁判所で公開された文書により明らかになりました。

この訴訟は、著作権をめぐる多くの争いの一つで、原告には著名な著者が含まれています。Metaはアイデア保護された作品をトレーニングデータとして使用することは「フェアユース」であると主張していますが、原告らはこれに反対しています。

内部のチャットで、Metaの従業員は著作権に問題のある作品を使うことを認識しながらも、実行に移すべきだと議論しました。特に、著作権で保護された本を小売価格で購入する方法が提案されたり、著作権を侵害したデータの使用が議論されました。

さらに、Libgenという著作権作品へのリンク集を利用する可能性についても言及されました。Libgenは過去に法的問題を抱えており、Meta内でも議論が行われていました。従業員は、これらのデータがAIの競争力向上に不可欠であると認識していました。

また、MetaがRedditのデータをスクレイピングしている可能性や、内部でモデルのトレーニングデータを調整して著作権に敏感なプロンプトを回避するための設定を行っていることも示唆されています。原告は、Metaが著作権侵害された書籍とライセンス可能な書籍のデータを照合していたと主張しています。

この問題は、Metaにとって非常に重要な法的リスクであり、Defenseチームには注目の高い弁護士が加わっています。Metaはこの件に関するコメントを提供していません。