

ある研究論文では、AppleはApple Intelligenceの学習にユーザーのデータを使用していないと明確に述べられています。これは、ChatGPTセッションをモデルの学習に活用するOpenAIのポリシーとは異なります。
しかし、Apple は Applebot 経由でウェブサイトのコンテンツをスクレイピングしており、ウェブサイト所有者はこれを防ぎたい場合、明示的にオプトアウトする必要があると述べています…
生成AIシステムのトレーニング方法
ChatGPT や Apple Intelligence などの大規模言語モデル (LLM) は、人間が作成した大量のサンプル テキストを入力することでトレーニングされます。
OpenAIはさらに進んで、デフォルトでChatGPTセッションも追加のトレーニング教材として使用します。オプトアウト(下記参照)も可能ですが、ほとんどのユーザーはこれが行われていることを知らないため、オプトアウトの方法がわかりません。
AppleはあなたのデータをApple Intelligenceのトレーニングに使用しません
今週公開された研究論文では、Apple が独自のデバイス上およびサーバー上のモデルをトレーニングする方法と、同社が導入している保護策の概要が説明されている。
保証されているのは、Apple Intelligence とのやり取りがトレーニング教材として使用されることはないということです。
当社は、基礎モデルをトレーニングする際に、ユーザーの個人的な個人データやユーザーインタラクションを使用することはありません。
このポリシーは、iOS 18 および macOS 15 で Siri から引き渡される ChatGPT の使用にも適用されることに注意してください。
ウェブスクレイピングは行われるため、所有者はオプトアウトする必要がある
しかし、OpenAIやGoogleと同様に、Appleもモデルを構築するためにWebをスクレイピングしており、Webサイトの所有者が明示的にオプトアウトしない限りは、これは問題ないと想定するという同じアプローチをとっています。
AppleのウェブスクレーパーであるApplebotは、Siriの学習や、デバイスを超えたSpotlightの提案の表示に役立てるために、既に何年も前からこの技術を活用してきました。Applebotは現在、Apple Intelligenceの学習にも活用されています。
私たちは、特定の機能を強化するために厳選されたデータや、ウェブクローラーであるAppleBotによって収集された公開データなど、ライセンスデータに基づいて基盤モデルをトレーニングしています。ウェブパブリッシャーは、データ使用制御を設定することで、Apple Intelligenceのトレーニングにおけるウェブコンテンツの使用をオプトアウトすることができます。
オプトアウトの手順については以下を参照してください。
ウェブコンテンツに対するAppleの追加保護
Appleは、Webコンテンツに追加の保護を適用し、誤って個人データが含まれないようにし、潜在的に不快なコンテンツをフィルタリングすることを意図していると述べている。
インターネット上で公開されている社会保障番号やクレジットカード番号などの個人を特定できる情報を除去するフィルターを適用しています。また、不適切な表現やその他の低品質なコンテンツもフィルタリングし、トレーニングコーパスに含まれないようにしています。
より一般的に言えば、Apple は、Apple Intelligence の出力に偏った内容が反映されないように努めていると述べている。
当社は、AI ツールやモデル全体にわたって固定観念や体系的な偏見が永続しないように継続的に取り組んでいます。
GIGO(Garbage In, Garbage Out)は、法学修士課程における大きな問題の一つです。例えば、ウェブ上には性差別的・人種差別的なコンテンツが溢れていますが、これをフィルタリングする手段がなければ、AIはそれをそのまま吐き出してしまう可能性があります。
Apple Intelligenceトレーニングのオプトアウト
ウェブ パブリッシャーは robots.txt ファイルに指示を含めることでオプトアウトできます。これは、ウェブサイトが Google によるインデックスを制御するために長年使用されてきた方法と同じです。
Applebotは、Applebotを対象とする一般的な検索クロールにおいて、標準のrobots.txtディレクティブを尊重します。この例では、Applebotは/private/または/not-allowed/以下のドキュメントをクロールしません。
User-agent: Applebot
Allow: /
Disallow: /private/
User-agent: *
Disallow: /not-allowed/
さらに、Apple は Googlebot に向けた指示も尊重することで、慎重な姿勢をとっています。
なお、Apple Intelligence のトレーニングをオプトアウトしながらも、コンテンツを Spotlight 検索用にインデックス登録できるようにすることができます。これは、ユーザーエージェントを Applebot-Extended に設定することで実行されます。
ChatGPTトレーニングのオプトアウト
前述のとおり、ChatGPT は iOS 18 および macOS 15 での Siri ハンドオフから生じるインタラクションについてはトレーニングされません。ただし、ChatGPT との現在のインタラクションをトレーニング マテリアルとして使用したくない場合は、これもオプトアウトできます。
iOSアプリ
- 右上の3つのドットメニュー、設定 > データコントロール
- 「すべてのユーザー向けにモデルを改善する」をオフにします。
Macアプリ
- メニューバーで、ChatGPT > 設定 > データコントロール
- 「すべてのユーザー向けにモデルを改善する」をオフにします。
9to5Macコラージュ:背景はApple、AppleロゴアイコンはIcons8によるもの。Applebot -Extendedのスポットを提供してくれたMattに感謝します。
havebin.com を Google ニュース フィードに追加します。
FTC: 収益を生み出す自動アフィリエイトリンクを使用しています。詳細はこちら。