大手ウェブサイトは、AIの訓練のためにAppleのコンテンツスクレイピングをオプトアウトしている

大手ウェブサイトは、AIの訓練のためにAppleのコンテンツスクレイピングをオプトアウトしている

  • Oligur
  • 0
  • vyzf
大手ウェブサイトは、AIの訓練のためにAppleのコンテンツスクレイピングをオプトアウトしている
  • ニュース
ウェブサイトはAppleのAIスクレイピングをオプトアウトしている
AIの訓練のためにウェブサイトのコンテンツをスクレイピングするボットクローラーは、検索機能の向上といった他の用途よりも議論を呼んでいる。
写真:Cult of Mac Deals

木曜日の新たな報道によると、多くの著名な報道機関やソーシャルメディアプラットフォームが、ウェブサイトスクレイピングによるAppleのAIトレーニングデータ収集をオプトアウトしたという。

Appleは、わずか3ヶ月前に導入した「Applebot-Extended」という新しいツールを使ってこれを実現しています。大手コンテンツウェブサイトがAppleのAIスクレイピングをオプトアウトした場合、Apple Intelligenceの継続的な開発に影響を与える可能性があります。

大手ウェブサイトのいくつかはAppleのAIスクレイピングをオプトアウトしている

Wiredの報道によると、AppleのAIデータ収集をブロックしている企業には、Facebook、Instagram、Craigslist、Tumblr、The New York TimesThe Financial TimesThe Atlantic、Vox Media、USA Today network、Condé Nastなどがある。ロボットクローラーに対する「冷淡な反応」は、こうしたツールがAIの訓練に役立つようになった現在、ボットクローラーが「知的財産とウェブの未来をめぐる紛争地帯」に足を踏み入れたことを示唆している。

Appleがオプトアウトオプションを延長

一部のコンテンツスクレーパーとは異なり、Applebot-Extendedはウェブサイト所有者がAppleのAIトレーニングにおけるデータ利用を阻止することを可能にします。しかし、それでもなお、オリジナルのApplebotは検索機能の向上のためにウェブサイトをクロールすることができます。最近、関連事項をめぐって論争が巻き起こりました。Appleは、YouTube動画を同意なしにAIトレーニングに利用しているという非難を否定しました。

そのため、一部の大手サイトはAIスクレーパーのオプトアウトを悪用しているようですが、これはApple Intelligenceに不利に働く可能性があります。ウェブサイト所有者は、ウェブクローラー管理のための長年のプロトコルであるrobots.txtファイルを更新することで、Applebot-Extendedをブロックできます。

パートナーシップを目指していますか?

それでも、分析によると、現在、トラフィックの多いウェブサイトの約6%から7%がApplebot-Extendedをブロックしており、その大部分はニュースやメディア関連です。Applebot-Extendedはまだ新しいため、一部のサイトではまだその使用に対処できていません。しかし、一部のパブリッシャーは戦略的なアプローチをとっており、パートナーシップ契約が締結されるまでデータを公開しない可能性もあるようです。

そのため、コンデナストなどの一部のメディア企業は、作成者と提携した後、特定の AI ボットのブロックを解除しました。

AIスクレイピングには批判もある

Wired の記事で論じられているように、従来は目立たなかった robots.txt ファイルが AI トレーニング データの戦場となっており、AI 時代の知的財産権をめぐる広範な緊張を反映しています。

そして、疑問が湧いてくる。もしApple Intelligenceが一般公開されて急上昇したら、多くの大手サイトが、自分たちもその動きに加わろうと躍起になるのではないか? 今後、Appleと出版社の契約がさらに増えるかもしれない。