概要
ソーシャルネットワークBlueskyは、ユーザーが自分の投稿やデータが生成AIのトレーニングや公的アーカイブのためにスクレイピングされることを希望するかどうかを示す新しいオプションをGitHubで提案しました。
CEOのジェイ・グレイバーは、南西部のSXSWでこの提案について語り、金曜日の夜にBlueskyで投稿したことで再び注目を集めました。
一部のユーザーは、Blueskyが以前の「ユーザーデータを広告主に販売しない」という方針を覆すものと捉え、驚きの声を上げました。
グレイバーは、生成AI企業がすでにBlueskyを含む公的データをスクレイピングしていると説明し、Blueskyはそのスクレイピングを管理する「新しい基準」を作ろうとしていると述べました。
提案によれば、Blueskyアプリのユーザーは設定で自分のデータの使用を許可または拒否でき、生成AI、プロトコルブリッジ、大規模データセット、ウェブアーカイブの4つのカテゴリに分かれています。
ユーザーが生成AIのトレーニングにデータを使用しないことを示すと、提案では「AIトレーニングセットを構築する企業や研究チームは、この意図を尊重することが期待される」としています。
Molly Whiteはこの提案を「良い提案」と評価し、BlueskyがAIのスクレイピングを歓迎するのではなく、すでに行われているスクレイピングに対してユーザーが意向を伝えるための合意信号を追加しようとしていると指摘しました。
しかし、彼女はこの提案が「良い行動をすることを望むスクレイパーに依存している」とし、過去にrobots.txtを無視してスクレイピングを行った企業があることを懸念しています。
ポイント
- Blueskyはユーザーが投稿データのスクレイピングを許可するか選べる提案を発表。
- CEOのグレイバー氏は、AI企業が既に公的データをスクレイピングしていると説明。
- 提案はユーザーの意向を尊重することを期待するが、法的拘束力はない。
詳しい記事の内容はこちらから
参照元について
