以前にも紹介したように、大規模な人工知能(AI)モデルの台頭は、機械によるウェブコンテンツの利用を規定する社会契約を根底から揺るがしました。今日、機械は単にウェブを検索しやすくしたり、新たな洞察を得たりするためだけにウェブにアクセスしているわけではありません。私たちが知るウェブを根本的に変え(そして脅かす)アルゴリズムにデータを供給しているのです。かつては主に互恵的であったエコシステムは、今やデフォルトで搾取的なものになるリスクを抱えています。
これに対応するため、クリエイター、パブリッシャー、コンテンツ管理者が、自身の作品がどのように使用されるかについての主体性を取り戻すことを支援する新しいアプローチが登場しています。
「クローリングへの対価(Pay-to-Crawl)」は、注目を集め始めているアプローチの1つです。「クローリングへの対価」とは、テキスト、画像、構造化データなどのデジタルコンテンツに機械がアクセスする際、ウェブサイト側が自動的に対価を得られるようにする新たな技術システムを指します。私たちは最近、この「クローリングへの対価」システムに関する私たちの解釈と見解を、専用のイシューブリーフとして公開しました。

「クローリングへの対価」に関するCCの立場
責任を持って実装されれば、「クローリングへの対価」は、ウェブサイトがコンテンツの作成と共有を持続させ、代替的な利用を管理するための手段となり得ます。これにより、本来であれば共有されなかったり、より制限の厳しいペイウォールの向こうに消えてしまったりする可能性のあるコンテンツを、公開されアクセス可能な状態に保つことができます。
しかしながら、私たちは重大な懸念も抱いています。
「クローリングへの対価」は、AIクローラーによるサーバーダウンを防いだり、副収入を得たりしようとする独立系のウェブサイトにとっては、適切な戦略となる可能性があります。しかし他の領域では、「クローリングへの対価」システムが権利者によって悪用され、人間のアクセスを犠牲にして過剰な利益を生み出し、必ずしも元のクリエイターに利益をもたらさない事態になりかねません。
「クローリングへの対価」システム自体が新たな権力の集中をもたらし、私たちがウェブをどう体験するかを支配する力を持つようになる可能性もあります。コンテンツがどのように利用されるかを監視し、コントロールしようとするその動きは、デジタル著作権管理(DRM)の最悪な部分に似ており、ウェブを共有とリミックスのメディアから、厳重に監視されたコンテンツ配信経路へと変えてしまう恐れがあります。
また、「クローリングへの対価」システムが無差別に利用されることで、研究者、非営利団体、文化遺産機関、教育者、その他公益のために活動する人々のコンテンツへのアクセスが遮断される可能性についても懸念しています。非営利目的の調査・研究(EUにおける)やフェアユースの例外(米国における)といった著作権法の例外や制限、さらに翻訳やアクセシビリティツールのための規定によって保障されているコンテンツへの法的アクセス権は、時間をかけて慎重に交渉され、調整されてきたものです。浅はかで適切なデザインを欠いた設計の不十分な「クローリングへの対価」システムが導入されることで、これらの権利が妨げられる可能性があります。
責任ある「クローリングへの対価」にするための原則の提案
「クローリングへの対価」システムは中立的なインフラではありません。これらのシステムが、単に知識や創造性の共有に対する障壁を作り出し、少数の者に利益をもたらすのではなく、クリエイターとコモンズの利益にかなう形で構築・使用されることが不可欠です。
私たちは、このビジョンに沿って「クローリングへの対価」システムの開発を導くための指針として、以下のような原則案としてまとめました。
- 「クローリングへの対価」をデフォルトの設定にすべきではない。
「クローリングへの対価」は一部のウェブサイトには有効な戦略かもしれませんが、すべてのウェブサイトが同じ根本的な懸念を共有しているわけではありません。「クローリングへの対価」システムは、ドメインホスト、コンテンツデリバリーネットワーク、その他のウェブサービスプロバイダーなどによって、ウェブサイトの代わりに自動的、あるいは前提となる設定として展開されるべきではありません。 - 「クローリングへの対価」システムは、一律のルールではなく、選択肢とニュアンスを可能にすべきである。
「クローリングへの対価」システムは、ウェブサイトがさまざまな種類のコンテンツ利用者(商用AI企業、非営利団体、研究者、あるいは特定の組織など)や、機械による利用の種類と目的(モデル学習、検索用インデックス作成、推論/検索など)を区別し、それぞれに対して異なる制御を設定できるようにすべきです。システムは、翻訳やアクセシビリティサービスの制限を含め、人間による直接のブラウジングやコンテンツの利用に影響を与えるべきではありません。 - 「クローリングへの対価」システムは、単なるブロックではなく、スロットリング(帯域制限)を許容すべきである。
「クローリングへの対価」システムは、ウェブサイトがコンテンツを完全に遮断することなく、ホスティングコストや、機械によるトラフィック増大のその他の影響を管理できるようにすべきです。例えば、システムは、大規模AIモデルによる「エージェンティック・ブラウジング」や「推論」によって引き起こされるトラフィックをスロットリング制限する一方で、研究やアーカイブなど、トラフィックがはるかに少ない他の形態の機械アクセスを許可できるようにすることが考えられます。 - 「クローリングへの対価」システムは、公益目的のアクセスおよび法的権利を保護すべきである。
「クローリングへの対価」システムは、研究者、非営利団体、文化遺産機関、教育者、その他公益のために活動する人々のコンテンツへのアクセスを妨害してはなりません。また、これらのシステムは、著作権の例外や制限によって保護されているコンテンツの合法的な利用や、公益のために付与されているその他の法的権利をブロックするべきではありません。「クローリングへの対価」のシステムに従わないと決定したことだけで、合法であったはずの利用を違法行為に変えるようなことがあってはなりません。 - 「クローリングへの対価」システムは、オープンで相互運用可能な、標準化されたコンポーネントを使用すべきである。
「クローリングへの対価」システムは、独自の(プロプライエタリな)チョークポイントやゲートキーパーになるべきではありません。ウェブサイトが特定の「クローリングへの対価」システムにロックインされる原因となりかねない、認証や決済のための独自のコンポーネントの使用には特に注意を促します。 - 「クローリングへの対価」システムは、コモンズへの集団的な貢献を可能にすべきである。
個々のウェブサイトとコンテンツ利用者の間の金銭的取引のみを可能にする「クローリングへの対価」システムは、コンテンツの価値が細分化された、極めて取引偏重な未来を生み出すリスクがあります。「クローリングへの対価」システムは、クリエイターやパブリッシャーの連合に対する支払いなど、集団的な形態での支払いや、デジタルコモンズに貢献することのより広範な概念をサポートすべきです。 - 「クローリングへの対価」システムは、監視やDRMのようなアーキテクチャを回避すべきである。
「クローリングへの対価」システムは、コンテンツの利用に関連する過度なログ記録、フィンガープリンティング、または行動追跡を導入してはなりません。システムは、コンテンツの二次利用以降(ダウンストリーム)を追跡しようとしたり、その利用方法を指示したりするのではなく、ユーザーの認証と決済に必要な最小限のデータ収集にとどめるべきです。
今後の道筋:未来が決定される場に参加すること
私たちは、今こそ、互恵性、オープン性、そしてコモンズを優先する価値観を「クローリングへの対価」システムに吹き込み、関与し、影響を与えるべき時だと信じています。
ここで概説した原則に関するフィードバックと対話を歓迎します。皆様からのご意見は、私たちが今後「クローリングへの対価」システムや関連する取り組みに関与していく際の指針となるだけでなく、より幅広いCCコミュニティがこれらを理解する上での助けとなります。
本記事に貢献してくれた Jack Hardinges に感謝します。
2025年12月12日掲載
このブログ投稿は Creative Commons による “Where CC Stands on Pay-to-Crawl” を翻訳したものです。
翻訳に際して Gemini の出力を参考にしました。
(担当:豊倉)