AI

OpenAI、著作権侵害の疑惑に直面し、非公開書籍を利用した訓練の実態とは

概要

OpenAIは、著作権のあるコンテンツを無断で使用してAIを訓練しているとの非難を受けています。最近の論文では、OpenAIがライセンスを取得していない非公開の書籍を利用して、より高度なAIモデルを訓練していると指摘されています。AIモデルは、膨大なデータからパターンを学習し、単純なプロンプトから推測を行う複雑な予測エンジンです。新しい論文によると、OpenAIのGPT-4oモデルは、O’Reilly Mediaの有料書籍を使用して訓練された可能性が高いとされています。GPT-4oは、以前のモデルに比べてO’Reillyの有料書籍の内容を強く認識していることが示されています。著者たちは、GPT-4oが多くの非公開のO’Reilly書籍を認識していると結論付けていますが、これは決定的な証拠ではないとしています。OpenAIは、著作権データの使用に関する訴訟に直面しており、この論文はその状況をさらに複雑にしています。

ポイント

  1. OpenAIは無許可で著作権保護されたコンテンツを使用しているとの指摘がある。
  2. 新たな研究により、GPT-4oがO’Reillyの有料書籍を学習した可能性が示唆された。
  3. OpenAIは著作権データの使用に関する訴訟に直面しており、批判が高まっている。

詳しい記事の内容はこちらから

参照元について

『TechCrunch』のプロフィールと信ぴょう性についてここでは『TechCrunch』の簡単なプロフィール紹介と発信する情報の信ぴょう性についてまとめています。 記事を読む際の参考にし...