ブログ

パブリックドメインの資料を利用する際に所蔵機関について言及することを利用者に促すには

本記事のPDF版はこちら

Ocean Coast by Maurice Denis、パブリック・ドメイン・マーク、スウェーデン国立美術館

はじめに

本ガイドラインは、デジタル化されたパブリックドメインの文化遺産資料の利用に関して、それを所蔵する文化遺産所蔵機関が自身への言及を利用者に促したい場合のデザイン上のアイディアと実施例を提供するものです。本ガイドラインはパブリックドメイン資料をオープンに共有する所蔵機関を対象としていますが、文化遺産の電子資料に関連する著作権ライセンス問題に関心のあるすべての人にとって有益であると考えます。

背景

オープンカルチャーの広まり

文化遺産所蔵機関は、所蔵する資料を保存し共有することで、地域社会にとって欠かすことのできない役割を担っています。そしてインターネットとそれに伴うデジタル革命によって、所蔵機関が相次いで収蔵品をオンラインで公開し始めました。つまり、著作権の制約がない、またはほとんどない状態で、無料でアクセス、利用、再利用できるように広く公開されるようになったのです。クリエイティブ・コモンズの「Open Culture Voices」シリーズで多くの専門家が述べているように、オープン化は地域社会や一般市民に対して計り知れないほどの恩恵をもたらします。クリエイティブ・コモンズ(CC)ライセンスパブリック・ドメイン・ツールは、「オープン」を実現するための重要な要素です。

パブリックドメイン作品のデジタル複製を公開するときに使えるCCライセンスはない

デジタル化され、オンラインで利用できるようになった多くの文化遺産は、著作権の保護期間を過ぎている、あるいはそもそも保護されていなかったパブリックドメインのものであり、著作権の許諾なく、誰でもどのような目的でも利用することができます。CCでは、パブリックドメイン作品の忠実なデジタル複製は、パブリックドメインとすべきであり、新たな著作権や関連する権利を生じさせてはならないと強く主張しています(和訳版はこちら)。同じ文脈で、ライセンスは著作権で保護されているコンテンツに関してのみ使用できるものであるため、パブリックドメイン作品のデジタル複製物を公開する際にCCライセンスを使用することはできません。それらを共有するには、現在、パブリックドメインに置くためのツール(CC0)の利用を推奨しています。

広く実践されているが問題のある「PD BY」

しかしながら、非常に多くの所蔵機関がCC0ではないCCライセンスを使って、パブリックドメイン資料の忠実な複製を公開しています。これは「PD BY」とも呼ばれることがあります。なぜこのようなことが広まったのでしょうか?それは、多くの所蔵機関が、文化遺産を保存、修復、デジタル化、共有しているのが自分たちであることを周知したいと考えているためです。そしてこれらの所蔵機関は利用者にクレジットを表記することを求める手段としてCCライセンスを使用しているのです。一方でCC0は帰属の表示を義務付けていません。私たちが作成した「 Needs Assessment Report: Are the Creative Commons Public Domain Tools Fit-for-Purpose in the Cultural Heritage Sector?」の資料でも、アンケートに回答した所蔵機関の約53%が、利用者にクレジット表記をしてもらう方法を求めていると答えており、素材が再利用・共有される際に所蔵機関がクレジット表記を受ける方法が無いことが、CC0で足りていない主なニーズであることが明らかになっています。

パブリックドメイン資料のより良い共有方法について

多くのコレクションが複雑な歴史的・法的背景を経て所蔵機関の管理下にあることを私たちは認識しています。私たちが先住民の文化遺産をオープンに共有することに関連して述べたように、対象物の著作権の状態は、正当な所有権や管理者を決定することはもってのほか、アクセスや利用の可能性を決定する唯一の方法では決してありません。

Sharing Public Domain Collections CC-BY ?!!? by Brigitte Vézina は “The Scream” をリミックスしたものです。本作品はCC BY 4.0のもとで提供されています。
The Scream” Edvard Munch (1893), Public Domain, National Museum Oslo

管理している所蔵機関をCCライセンスで参照するのは
得策ではない

私たちは、所蔵機関が自分たちのコレクションからのパブリックドメインのデジタルなオブジェクトが利用される際に、自分たちが言及されること望むことに概ね共感しており、功績を認めるべき内容についてはユーザーはそのことをクレジット表記するべきだと考えます。しかし私たちは、実際にそれを行う手段としてCCライセンスを使用することに、以下の4つの主な理由から強く反対します:

  • 資料の著作権状態が不明確になってしまう
  • 資料へのアクセスや利用条件について利用者に混乱と誤解が生じる
  • ライセンスが無効となり法的強制力がない状況を作り出してしまう
  • CCの帰属表示ガイドラインライセンス表記では、著作物のタイトル、作者または作成者、ライセンス、および出典(通常はURL)のみの記載を要求しているため、必ずしも所蔵機関の記載につながるとは限らない

所蔵機関は何をすべきか?

2022年、Deborah De Angelis(CC Italy)と渡辺智暁(CC Japan)が率いる CC Open Culture Platform のワーキンググループは、この問題を詳細に調査し「PD BY 」の問題に対処するための技術的、法的、社会的介入に関する提案を作成しました。

そしてワーキンググループの挙げた社会的介入策に触発され、私たちは、オープンライセンスまたはパブリックドメインの資料を利用する人々が資料を提供している所蔵機関に言及することを簡単かつ魅力的にするために、所蔵機関が導入できるシンプルなデザインアイデアを開発しました。Behavioural Insights Team の EASTモデル(「ナッジ」によって行動変容を起こしたり、特定の結果を促したりするためのシンプルなフレームワーク)を使って、適切な場面で所蔵機関が包括的な「典拠ステートメント」を提供するためのいくつかの方法を提案します。これらのユーザー・エクスペリエンスに関するアイデアは、CCライセンスやその他ツールと組み合わせて使用することができます。提案する機能の実装方法に関するHTML/CSSコードを含む技術的なガイドラインは提供しませんが、このリソースが各所蔵機関の技術環境に実装可能なデザインの青写真となることを願っています。

所蔵機関のためのクリエイティブ・コモンズの
ガイドライン

どのような情報を含めるべきか?

適切なステートメントには、以下の情報を含めるべきです:

  • タイトル
  • 著者または作成者
  • ライセンスまたは許諾
  • 所蔵機関
  • 出典

こちらはその例です:

Ocean Coast by Maurice Denis、パブリック・ドメイン・マーク、スウェーデン国立美術館
https://collection.nationalmuseum.se/eMP/eMuseumPlus?service=ExternalInterface&module=collection&objectId=23187

所蔵機関はどのようにユーザーを促すことができるか?

所蔵機関は Behavioral Insights Team の EASTモデルを使って、ユーザーを誘導したり言及を促すことができます:

  • Easy(簡単) – 人々が参照しやすいようにする。
  • Attractive(魅力的) – 人々がやりたくなるようなものにする。
  • Social(社会的) – 行動を社会的価値につなげる。
  • Timely(タイムリー) – 適切なタイミングで情報を提供する。

所蔵機関がEASTモデルを適用するための簡単で戦略的な方法をまとめると以下ようになります:

Easy(簡単)にする方法

  • ワンクリックで参照先をコピーできるようにする
  • 参考文献のテキストを自動ハイライトする

Attractive(魅力的)にする方法

  • 資料を使ってくれることに感謝の意を述べる
  • ユーザーにとって情報をわかりやすく提供する
  • すべての情報を同時に提供する

Social(社会的)にする方法

  • ダウンロード数の共有
  • 参照情報のコピー回数の共有
  • 適切な参考文献の例を示す
  • ユーザーにソーシャルメディア上で機関のタグ付けを促す
  • 出典を示すことで信頼を築く

Timely(タイムリー)にする方法

  • 資料がダウンロードされたときにポップアップを表示する
  • ダウンロードしたファイルと一緒に参照情報を提供する
  • 参照情報をメールで送信する
  • ユーザーアカウントを提供し、ユーザーが自身のダウンロード履歴を見られるようにする

実際にナッジの実装例を見てみましょう

このセクションでは、これらの戦略が実際にどのように実装されるか、4つのデザイン案を提示します:

  • コピーボタン
  • 自動ポップアップ
  • テキストファイルをダウンロードするオプション
  • ダウンロード履歴が参照できるユーザープロフィール

典拠ステートメントを簡単にコピーできるボタン

ポップアップで典拠ステートメントを表示

資料と一緒にテキストファイルをダウンロードする

ダウンロード履歴が残るユーザープロフィール

設計のためのデータ整理

このセクションでは、(すべて JSON-LD で動作する)限定的なフレームワークと、典拠ステートメントを含めるのに適した構造を提供するプラットフォームの例を挙げます。

JSON-LD とは?

JSON-LD は軽量のリンクトデータ形式です。リンクトデータとはウェブサイト間で標準ベースの機械可読データのネットワークを構築する方法で、ウェブ上で情報を公開したり利用したりすることを可能にします。JSON-LD は人が読み書きしやすく、すでに成功している JSON フォーマットをベースにしています。JSON-LD は、JSON データをウェブのスケールで相互運用するための方法を提供します。JSON-LD は以下のプラットフォームの例に共通する標準であり、主要な検索エンジンによって推奨され、Internationalized Resource Identifier(RDI)を使用しています。

データフレームワーク

Schema.org の 「CreativeWork」

Schema.org は、インターネット上の構造化データのためのスキーマを作成し、維持し、普及させることをミッションとする共同的なコミュニティによる活動です。スキーマは「タイプ」の集合であり、それぞれが項目の集合に関連付けられ、階層構造になっています。検索エンジンの発見性を高めるための最良の選択肢です。

CreativeWork のタイプには、以下のような数多くの項目があります:

  • 名前(タイトル)
  • 著者および作成者
  • ライセンスと構造化データライセンス
  • 発行者
  • URL
  • 著作権表示とクレジット

これらの項目は、コレクションのデータを標準化された機械可読な方法で構造化することを可能にします。入力データは、別の項目、例えば著作権表示やクレジットの項目を入力するために使用できます。

IIIF の 「requiredStatement」

International Image Interoperability Framework(IIIF)は、コレクション管理のための世界標準であり、世界中の文化遺産機関で広く利用されています。

IIIFの 「requiredStatement」は、資料が表示または利用される際に表示する必要があるテキストです。例えば、著作権や所有権に関する記述、所有機関や公開した機関への言及、そのほか利用者に表示することが重要であると判断されるテキストを何であれ提供することができます。

IIIFの権利表明のための「クックブック」は、ソースコードのガイドラインと実装方法を提供しています。

クリエイティブ・コモンズは所蔵機関に対し、利用者に参照してもらいたいすべての情報を「requiredStatement」に含めることを推奨しています。これには、タイトル、作成者または作者、提供機関名、著作権の状態、使用されているライセンスまたはパブリックドメインツール、出典が含まれます。

ccREL について

The Creative Commons Rights Expression Language(ccREL)は、著作権のライセンス条項や関連情報を機械可読的に表現するためのクリエイティブ・コモンズの標準です。ccRELは、World Wide Web Consortium の Resource Description Framework(RDF)に基づいています。2008年に提案されましたが、それ以来この標準への支持は著しく減少しています。現在は検索エンジンでの発見性向上のために ccREL を使用することは推奨されていません。検索エンジンでの発見性向上のためには Schema.org の 「CreativeWork 」の使用をお勧めします。

共有のためのプラットフォーム

所蔵機関が所蔵するデジタル・オブジェクトを共有するためのプラットフォームは数多く存在します。ここでは、このガイドラインで提示されているデザインアイデアの一部をすでに実装している2つのプラットフォームを紹介します。

Europeana

Europeana は、ヨーロッパの文化遺産コレクションの統合プラットフォームです。公開されている API やその他のツールを使用してデジタルコレクションに関する情報を収集し、ヨーロッパのデジタル化されたコレクションへのアクセスと要覧を世界に提供しています。

このプラットフォームは、ユーザーが資料をダウンロードする際にステートメントを提供します。このステートメントには提供機関からの情報が入力され、Europeana への投稿に最低限必要なメタデータの一部となります。現在は提供機関へのレファレンスが含まれるようになっています。ステートメントは以下のフォーマットに従っています:

 [タイトル] by [作成者] – [年] – [提供者], [国] – [権利に関するステートメント]

ウィキメディア・コモンズ

ウィキメディア・コモンズは、ウィキメディアが提供する画像、音声、動画を含むメディアファイルのコレクションです。アップロード者が資料のメタデータに帰属表示情報を追加した場合、その情報が利用者に対して表示されます。帰属表示に関する情報はメタデータ情報に書き込むことができ、資料のタイトル、作成者、出版機関、著作権ライセンスまたはパブリックドメインツールの情報を入力することができます。これは 「Other fields = {{Credit line}}」のセクションに含めるのがベストです。

追加のサポート

これらのデザインのいずれかを実装する予定はありますか?このガイドラインを発展・改善させる方法(特に技術的な面で)についてご意見はありますか?この資料を他の言語で提供したいですか?

その場合は:

謝辞

このガイドラインは、オープン・カルチャー・コーディネーターの Connor Benedict とクリエイティブ・コモンズの政策・オープン・カルチャー担当ディレクターの Brigitte Vézina によって作成されました。また本ガイドラインの作成にあたって、 Deborah De Angelis (CCイタリア)と渡辺智暁(CCジャパン)が率いるオープン・カルチャー・プラットフォームのワーキンググループのメンバーや、他のクリエイティブ・コモンズコミュニティのメンバー、クリエイティブ・コモンズのスタッフからの有益なフィードバックを受けることができましたことを深く感謝します。

画像のクレジット

その他のクレジット

本資料は Creative Commons による “NUDGING USERS TO REFERENCE INSTITUTIONS WHEN USING PUBLIC DOMAIN MATERIALS” を翻訳したものです。

元の資料のライセンス表示:Creative Commons 2024 | Creative Commons Attribution License 4.0 (CC BY 4.0)

本資料はクリエイティブ・コモンズ 表示 4.0 ライセンスの下に提供されています。

翻訳に際して DeepL の出力を参考にしました。

5/21(火) 生成AIと著作権法制度の未来イベント開催のお知らせ

※本イベントのお申込みは終了いたしました。

クリエイティブ・コモンズ・ジャパン(CCJP)では、生成AIと著作権法・制度の未来について議論するイベントを開催いたします。生成AIによって文化とシェアの関係、クリエイターとデジタル技術の関係など、クリエイティブ・コモンズ・ジャパンが議論してきた領域で数々の論点が浮上しています。法律の専門家だけでなくクリエイター、技術者、一般市民、法学以外の政策研究者など様々な方の意見も踏まえて議論することの重要性もしばしば指摘されるところです。
そこで本イベントでは、デジタル技術や創作活動、文化におけるシェアの役割、著作権法や制度の未来について考えたい方の幅広いご参加を歓迎します。また、今後の幅広い議論に資するような中長期的な課題や問いを議論することを目指したいと思います。

【開催概要】
「生成AIから考える著作権法・制度の中長期課題」

主催:クリエイティブ・コモンズ・ジャパン
後援:国際大学グローバル・コミュニケーション・センター(GLOCOM)
日時:5月21日(火)18:30-20:00
参加料:無料。(事後開催の懇親会は有料)
登壇者:
・奥邨弘司(慶應義塾大学大学院法務研究科 教授)
・中川譲(イラストレーター、宝塚大学 特任教授)
・増田雅史(弁護士、森・濱田松本法律事務所 パートナー)*
・渡辺智暁(国際大学GLOCOM 主幹研究員/教授/研究部長)(モデレーター兼担)*
(*印はCCJPメンバー)

開催形式:ハイブリッド形式
(オンラインはWebEx、オフラインは港区六本木にある国際大学GLOCOM
お申し込み:オンラインフォームより事前登録をお願いします。
※本イベントのお申込みは終了いたしました。

お問合せ・ご連絡先:
お申し込み期限後のキャンセルなどのご連絡は info at creativecommons.jp までメールでのご連絡をお願いします。( at は@マークに変換してください)

TAROC オープンカルチャーの推奨に向けて

TAROCとは、”Towards a Recommendation on Open Culture”の略語で、「オープンカルチャーに関する勧告に向けて」を意味します。TAROCは、クリエイティブ·コモンズが主導するコミュニティ・イニシアチブ(共同体構想)で、オープン文化の価値、目的、メカニズムを目的とする、積極的で肯定的で影響力のある国際的な勧告文書の作成を支援することを目的としています。これにより、より広範な文化および情報政策を活性化および支援する手段として、文化を世界的にオープンに共有することに繋がります。

このTAROCを紹介するWebページが英語、日本語などで公開されていますので、ご覧ください。

英語ページ: TOWARDS A RECOMMENDATION ON OPEN CULTURE
日本語ページ: TAROC オープンカルチャーの推奨に向けて
関連英語ページ: CC CELEBRATES 20 YEARS OF THE UNESCO CONVENTION ON SAFEGUARDING INTANGIBLE HERITAGE

(担当: 前川)

AI学習のためのプレファレンス・シグナルの可能性を探る

Catherine Stihler
2023年8月31日

作品をオープンに共有したい人々に、より多くの選択肢を提供することがクリエイティブ・コモンズ(CC)設立の動機の一つでした。様々なステークホルダーとの関わりを通して、私たちは彼らが直面する、著作権にまつわる「全面禁止か無制限か」な選択肢に対する不満を耳にしました。彼らは人々に対して、一部の用途では作品を共有したり再利用できるようにし、また一部の用途では利用を制限できることを希望していました。また、アーティスト、技術開発者、アーキビスト、研究者など、クリエイティブな資料を明確で理解しやすい許諾で再利用したいと望む人々を支援することもCCライセンスを作成する動機でした。

Choices” by Derek Bruff。一部切り抜き。もとのライセンスは CC BY-NC 2.0

そして何より、他の団体との交流によって明らかになったのは、人々が共有に意欲的であるのは、単に個人の利益のためではなく、むしろ社会的な利益を感じているからだということでした。多くの人々は、人々がアクセスし、それをもとに創作することのできる知識と創造性の集合体、つまりコモンズを支援し、拡大することを望んでいたのです。創造性は豊かなコモンズに依存しており、選択肢を広げることはこれを達成するための手段のひとつでした。

生成系の人工知能(AI*)に関する私達のコミュニティの協議でも類似するテーマが浮上しました。もちろん、2023年の社会におけるAIとテクノロジーは2002年のものとは異なります。しかし、作品群がAIの学習を含むあらゆる用途にオープンであるか、あるいは完全にクローズドであるかというオール・オア・ナッシングのシステムの課題は共通しています。創造性、コラボレーション、コモンズを支援するかたちで作品の再利用を実現したいという願いも当時と同様です。

頻繁に提起された選択肢のひとつは、プレファレンス・シグナリングでした。これは、ライセンスによって強制することはできないものの、クリエイターの希望を示すものとして、一部の用途についてのお願いをする方法です。私たちは、これが重要な検討すべき分野であることを理解しています。プレファレンス・シグナルを考える場合、豊かなコモンズを支援するための包括的なアプローチの一部であること(単に人々が既存の作品をもとに創作する特定の方法を制限するのではないこと)をどのように保証するかや、そのアプローチがオープンライセンシングの意図と両立できるかどうかなど、多くの難しい問題が出てきます。しかし同時に、プレファレンス・シグナリングがより良い共有のあり方を助けるポテンシャルを持っていると考えています。

私たちが学んだこと:幅広いステークホルダーがプレファレンス・シグナルに関心を持っている

生成AIについての私達のコミュニティとの協議に関する最近の投稿で、生成AIに関するコミュニティの幅広い意見を浮き彫りにしました。

生成AIを使って新しい作品を創作している人もいれば、創作、共有、稼ぐ能力を妨げると考え、明確な許諾なしに自身の作品がAIの学習に利用される現在の方法に異議を唱える人もいます。

自身の作品が生成AIの学習に利用されることに関して、多くのアーティストやコンテンツ制作者が、自身の希望をより明確に意思表示する方法を望んでいますが、その希望の内容は様々です。「全面禁止」ことと「無制限か」ことの両極の間には、生成AIの具体的な使われ方に基づくグラデーションがありました。例えば、生成AIが以下のどの用途で使用されるかによって異なっていました。

  • 新しい創作物を編集するため(Photoshop や他の編集プログラムを使って画像を加工するのと同様なもの)
  • 学習に利用された作品と同じカテゴリのコンテンツを作成するため(画像を使って新しい画像を生成するといったもの)
  • 特定の人物を模倣したり、その人物の作品を置き換えるため
  • 特定の人物を模倣したり、その人物の作品を置き換えたりして(非商業的なオマージュやパロディを行うのとは対照的に)商業的にそのアーティストになりすますため

また、(例えば研究者、非営利団体、企業など)誰がAIを作成し、誰が使用するかによっても見解は異なりました。

AIシステムの技術開発者やユーザーの多くも、クリエイターの意思を尊重するためのより良い方法を見つけることに関心を寄せていました。簡単に言うと、AIの学習に関してのクリエイターの意思表示を明確に把握することができれば、彼らはそれに快く従うとのことでした。彼らは要件が大きくなりすぎることに懸念を示していましたが、この問題は「全面禁止か無制限か」ではありませんでした。

プレファレンス・シグナル:豊かなコモンズとの複雑な関係

より良いプレファレンス・シグナルに対する広い関心はありましたが、それをどのように実践するかについての明確なコンセンサスはありませんでした。実際、これらの意思表示がコモンズにどのような影響を与え得るかについては、多少の課題と不確かさがあります。

例えば、生成AIがウェブでの出版にどのように影響を与えるかについての言及がありました。AIの学習に関する懸念はある人にとっては、今後作品をウェブ上で公開しない選択肢を取ることを意味していました。同様に、オープンライセンスで公開されたコンテンツや公益的な取り組みにどのような影響を与えるかを特に懸念する人もいました。もし人々が ChatGPT を使うことで、ウィキペディアを訪れることなくウィキペディアから得られた回答にアクセスすることができるのなら、ウィキペディアの情報コモンズは持続可能であり続けられるでしょうか?

この観点からすると、プレファレンス・シグナルの導入は、他の方法では共有されなかったかもしれない資料の共有を維持・支援すると考えられ、これらの緊張を収める新しい方法を可能にします。

一方、プレファレンス・シグナルがこのような利用を制限するためだけに広く展開されるのであれば、コモンズにとっては損失になりかねません。なぜならこれらの意思表示が表現を過剰に制限するような形で使われる可能性があるからです。例えば、特定のアーティストやジャンルにインスパイアされたアートを創作することを制限したり、人間の知識の重要な領域を学習したAIシステムから回答を得ることを制限するといったものです。

さらに、CCライセンスは、オープンソースソフトウェアライセンスと同じように、利用に関する制限に抵抗してきました。このような制限はしばしばあまりに広範であるため、望ましくない利用だけではなく、多くの価値ある、コモンズ的な利用をも断ち切ってしまいます。多くの場合、望ましくない利用の可能性と、良い利用によって開かれる機会とはトレードオフの関係にあります。もしCCがこのような制限を支持するのであれば、私たちが望むのは「コモンズ・ファースト」のアプローチであることを明確にする必要があります。

この緊張関係は簡単に解決できるものではありません。むしろ、プレファレンス・シグナルだけではコモンズを維持するのに十分ではなく、数多く存在する選択肢のうちの一つとして検討されるべきものであることを示唆しています。

既に存在しているプレファレンス・シグナルの取り組み

この記事において、ここまではプレファレンス・シグナルについての抽象的な話をしてきましたが、このテーマについてはすでに多くの取り組みが進行中であることに言及する必要があります。

例えば Spawning.ai は、アーティストが自身の作品が人気のある LAION-5B データセットに含まれているかどうかを調べ、データセットから除外するかどうかを選択するのに役立つツールに取り組んでおり、さらに、AI開発者がそのリストとの連携を可能とするAPIを作成しました。StabilityAI はすでに、アーティストの明示的なオプトインとオプトアウトを尊重しながら、これらの意思表示を、ツールの学習に使用したデータに組み込み始めています。人気サイト Hugging Face でホストされているデータセットのうち適合するものについては、Spawning の API を利用したデータレポートを表示するようになっています。データレポートは、オプトアウトされたデータとそれを除外する方法を学習済みモデルを作る人に知らせます。Spawning はまた、ウェブでコンテンツを公開している人々のために、robots.txt と似た、商業的なAIの学習のためのサイトのコンテンツ使用に関する制限や許可を示す「ai.txt」 ファイルのジェネレータにも取り組んできました。

同様の取り組みは他にも数多くあります。例えば、ワールド・ワイド・ウェブ・コンソーシアム(W3C)内の出版社からなるグループは、ウェブサイトがテキストやデータのマイニングに関して意思表示できるようにするための標準に取り組んでいます。EUの著作権法では、機械が読み取り可能なフォーマットを通じて、人々がテキストやデータマイニングからオプトアウトすることを明示的に認めており、この標準がその目的を果たすという考えです。Adobe は、自社が提供するいくつかのツールで生成された作品のために「Do Not Train」メタデータタグを作成し、Google は robots.txt と同様のアプローチを構築することを発表し、OpenAI は、将来のバージョンのGPTのためのクロールからサイトを除外する手段を提供しています。

プレファレンス・シグナル導入の課題と疑問

こうした取り組みはまだ比較的初期段階にあり、多くの課題や疑問があります。いくつか挙げてみましょう。

  • 使いやすさと導入のしやすさ:プレファレンス・シグナルが効果的であるためには、コンテンツ制作者や後続のユーザーにとって利用しやすいものでなければならなりません。使いやすく、スケーラブルで、さまざまなタイプの作品や用途、ユーザーに対応できる方法とはどのようなものでしょうか?
  • 選択肢を認証する:ある意思表示が、適切な当事者によって設定されたものであることをどのように検証し、信頼するのが最善なのでしょうか?関連して、誰がプリファレンスを設定することができるべきなのでしょうか?それは作品の権利者、作品を創作したアーティスト、あるいはその両者なのでしょうか?
  • アーティストのためのきめ細かな選択肢:これまでのところ、ほとんどの取り組みは、AIの学習のための利用を人々がオプトアウトできるようにすることに焦点が当てられています。しかし、上述したように、人々には様々な好みがあり、プレファレンス・シグナルは、人々が自分の作品が利用されることに問題がないことの意思表示をする手段でもあるべきです。人々がきめ細かな好みを表明できるようにしつつ、煩雑になりすぎないようにバランスを取るにはどうすれば良いでしょうか?
  • 作品とユーザーのタイプに応じた調整と柔軟性:この記事ではアーティストに焦点を当てましたが、もちろんクリエイターや作品の種類は多種多様です。例えば、プレファレンス・シグナルは科学研究にどのように対応できるでしょうか?ウェブサイトのインデックス作成という文脈では、営利目的の検索エンジンは一般的に robots.txt プロトコルに従いますが、アーキビストや文化遺産団体のような機関は、公益的使命を果たすためにクロールを行うことがあります。AIをめぐる同様の規範をどのように整備できるでしょうか?

プレファレンス・シグナルを構築する取り組みが進むのに合わせて、有益な道筋が見えてくることを期待して私たちはこれらを含めた様々な疑問を探求し続けます。さらに、共有とコモンズを支援するために必要なその他のメカニズムについても引き続き探求していきます。CCは、「AIとコモンズ」をテーマとする10月のサミットを含め、このテーマにさらに深く取り組んでいきます。

世界中の様々な人や機関と同じく、CCは生成AIを注視し、この驚くべき新しいツールが提起する多くの複雑な問題を理解しようとしています。私たちは特に、著作権法と生成AIが交わる部分に注目しています。より良い共有のためのCCの戦略は、人間のクリエイターの仕事も尊重しつつ、このテクノロジーの発展をどのようにサポートできるのか?誰にとってもより良いインターネットでAIが運用するにはどうすればいいのか?これらの問題を私たちは、CCチームとゲストによる一連のブログ記事で探求しています。そこでは、AIのインプット(学習データ)、AIのアウトプット(AIツールによって作成された作品)、そして人々がAIを使用する方法に関する懸念事項を取り上げています。詳細については生成AIに関する概要を読むか、AIに関するすべての記事をご覧ください。

* 注:「人工知能」や「AI」は、現在、機械学習や大規模な言語モデル(LLM)を含む複雑な技術や実践の分野を指す略語として使用しています。「AI」という略語の使用は便利ではありますが、これは理想的ではありません。なぜなら、AIは実際には(AIが人間によって作られ使用されるという意味で)「人工的」ではなく、さらに(少なくとも我々が人間の知性について考えるような意味で)「知的」でもないからです。


このブログ投稿は Catherine Stihler による “Exploring Preference Signals for AI Training” を一部省略し翻訳したものです。

また、翻訳に際しては DeepL の出力を参考にしました。

(担当:豊倉)

CCJP年次報告書(2022年度分)のお知らせ

クリエイティブ・コモンズ・ジャパン(CCJP)では、7月30日に最近一年ほどのCCJPやグローバルのCCの活動を紹介すると共に、生成系AIとオープンライセンスなどオープン化に関連した動向を紹介・議論するイベントを開催しました。このイベントの主なスライド資料を元に、CCJP年次報告書として公表させていただきます。末尾にはCCJPの母体であるNPO法人コモンスフィアの会計報告なども記載しています。ぜひ一度ご覧いただけたら幸いです。
報告書: オンラインスライド版 (Google Slides), PDF版

CCJP年次報告会2023にお申し込み頂いた皆様

Web参加でお申し込み頂いた方には当日視聴用URLご案内のメールをお送りしております。(7月27日18:00現在)

もしメールが届かないなどの不具合があればinfo at creativecommons.jp ( at は@マークに変換してください)までご連絡ください。

当日リアル参加でお申し込み頂いた方は、直接会場までお越しください。

皆様のご参加、心よりお待ちしております。

*報告会参加申し込みは締め切りました。(7月30日11:25AM)

7/30(日) CCJP年次報告会2023 開催のお知らせ

クリエイティブ・コモンズ・ジャパン(CCJP)では、最近一年ほどのCCJPやグローバルのCCの活動を紹介すると共に、生成系AIとオープンライセンスなどオープン化に関連した動向を紹介・議論するイベントを開催します。

私たちCCJPが普段どのような活動をしており、グローバルのCCではどのような動きがあるかをお伝えするとともに、最近のオープン化のトピックとしていわゆる生成系AIにおけるオープンライセンスやオープン化についてとりあげます。

CCやオープン化にまつわる情報共有と意見交換の機会としたいと思っていますので、CCの活動に興味をお持ちの方々はもちろん、著作権、オープンライセンス、AIとオープン化などにご関心のある方も、ぜひお気軽にご参加ください。

【開催概要】
「CCJP年次報告会2023」
日時:7月30日 (日) 16:00-18:00
参加料:メインプログラムは無料。懇親会のみ有料。
開催形式:ハイブリッド形式
(オンラインはWebEx、オフラインは港区六本木にある国際大学GLOCOM
お申し込み:オンラインフォームより事前登録をお願いします。*申し込みは締め切りました。

【プログラム(暫定版)】
※当日までに変更になる可能性があることをご了承ください。
16:00-16:30 最近のCCJPの活動報告(事務局 豊倉幹人、理事長 渡辺智暁)

(ライセンス執行に関する文書・ブログエントリ翻訳)
(NFT、オープンアクセスに関するFAQs、CCPL20周年記念イベント)

16:30-17:00 グローバル CC 活動紹介(CCJP事務局 前川充)

(Annual Report、CC Summit 2022)

17:00-17:15 休憩
17:15-17:45 生成系AIとオープン化(事務局 豊倉幹人、理事 水野祐、理事長 渡辺智暁)
17:45-18:00 質疑応答
18:30-    懇親会(会場近傍の飲食店にて)

お問合せ・ご連絡先:
お申し込み期限後のキャンセルなどのご連絡は info at creativecommons.jp までメールでのご連絡をお願いします。( at は@マークに変換してください)

「クリエイティブ・コモンズの現在地、シェアの未来」開催報告

クリエイティブ・コモンズ・ジャパンは、2023年1月15日に「クリエイティブ・コモンズの現在地、シェアの未来」と題したイベント を開催いたしました。

クリエイティブ・コモンズ・ライセンスのローンチの20周年を記念したものです。

クリエイティブ・コモンズ・ジャパンのメンバーを中心にパネルディスカッション形式で開催したトークセッションと近隣の会場で開催した懇親会で多岐に渡る議論を行いました。そこで登場した論点・意見のいくつかをご報告いたします。(読みやすさのため、執筆者の判断で再構成しています。)

1.20年間を振り返っての変化

著作権についての考え方

著作物をシェアするというアイディアが奇異の眼で見られることなく、ビジネスの戦略として受け入れられるようになったが、これは大きな変化。

CCライセンスの受容

CCライセンスがグローバルなデファクト・スタンダードとなった領域がある。オープンデータの領域がその好例で、公共的な情報資源の共有に用いられることは非常に増えた。他方、音楽や映画などのビジネス領域では利用例もあったが、広く使われるには至っていない。また、UGCと呼ばれるような領域では使われることも、そうでないこともある。

オープンなインターネットの光と影

様々なコンテンツがネット上で提供され、一面では非常に豊かになったが、他方では望ましいコンテンツばかりではないこと、多様なコンテンツを放置しておくことで発生する弊害も無視できないものになっている。コンテンツをシェアするプラットフォームについても様々な功罪が明らかになった。

2.積み残し課題や浮上した課題

クリエイターと報酬

中間搾取を減らし、クリエイターに金銭的にもより多くの報酬が提供される世界ができるのではないか、という構想は昔からある。近年ではWeb3の運動やブロックチェーンの活用によってそれが実現できる可能性も議論されている。だが、NFTの売買に使われるOpenSeaのように特定のプラットフォームに集中する現象はこうした新興領域にも見られるし、そのプラットフォームが取引料などを低く抑え続けるわけではないことも伺える。クリエイティブ・コモンズ・ライセンスの発足当初は、米国では大手プラットフォームではなくレコードレーベルや映画のスタジオなどが問題視されている時代だったが、こうした企業の影響力は以前として強い。また、そもそもクリエイターになりたい人の数が多く、そこに人々が割くアテンションの量が限られているためにクリエイターとして食べていけない人が多く出るという根本的な事情がある。

著作権とスマートコントラクト、支援ツール

クリエイターへの報酬に関連して特に解くことが難しい課題に、クリエイターへの適正な報酬がどの程度なのか、という問題がある。寄与分のようなものをどう評価するべきか、様々な考え方があり、人によって意見が大きく違う。システムとして実現することが簡単ではない。様々な試行錯誤が必要な領域とも言える。

著作権をアルゴリズムで書けるような明確なルールにできるのであれば、スマートコントラクトなどとの相性が良くなるのでは、という期待はまだあると思うが、ここ10年ほどの試行錯誤を通じて、スマートコントラクトのような取り組みでは、人間のレビューを不要にすることはできず、むしろ望ましくない結果を生むリスクが結構大きいということがわかった。法律も、起こりうる事態を事前にすべて見通してルールを作ることはできないため、法律が自動執行されることは望ましくないだろう。人間のレビューが入ることが望ましいだろう。

著作物の活用について何はOKなのか、そうでないのか、を支援してくれるツールにはニーズがある。著作権法の複雑さなどもあって、理解できずに利用を断念している人が多くおり、委縮効果があると言える。他方では、ライセンスも著作権法もほとんど気にせずシェアしている世界もあり、二極化と見ることもできる。

 生成系AI

生成系AIをめぐっては、多くの議論がある。著作権に関連があるものでも、AIの学習に著作物を利用されたクリエイターが対価を得るべきか、AIを使って特定のモデルを開発した者が著作権者になるべきか、モデルを上手に使って望むような画像を生成する試行錯誤を行った者は著作権者になるべきか、などが。その際に、これまで積み上げてきた法解釈と裁判例に基づいて考えて行くアプローチだけでなく、社会にとっての最適解は何であるかを考えるアプローチが考えられるだろう。

膨大な数の作品を短時間で生み出すことがAIには可能だが人間にはできないため、一方ではAIが生成するコンテンツが物量で人間の創作物を圧倒してしまうような未来も考えられる。クリエイターがツールとして活用し、意外性をとりいれたりする可能性もある。そうした可能性を念頭に社会にとっての正負両面の影響を探っていく必要があるだろう。

アカデミアのように、金銭的な報酬ではなく互いへのクレジットが主な駆動力となって機能している領域もあるし、ファッションのように著作権で保護されていないことで逆に絶えざるイノベーションと流行が生まれているとされることがある領域もある。

3.今後の方向性

クリエイティブ・コモンズはある状況に対してライセンスなどのツールの開発を持って改善を試み、一定の成果をあげたが、これを固守することが重要なのではなく、状況に応じてミッションを再定義することが重要だろう。

デジタル社会の正負両面にどう向き合っていくか、CCはもともと性善説に基づいていたようなところもあり、考えて行く必要がある。

安直な二項対立を排し、中間をどうデザインできるか、それがCC的なフィロソフィーの可能性だと思う。著作権のAll rights reservedとパブリックドメインの中間を支えたように。

アーロン・シュワルツは16歳でCCのアーキテクチャーをデザインし、ファウンダーのローレンス・レッシグはしばしばアーロンを自分のメンターとした。政治とカネのような問題に取り組むようになったのもアーロンがきっかけだった。受動的に物事が決まって行くのを待っていたり、技術の可能性や悪を離れたところから批判するよりも、議論に参加し、共に未来を作って行く態度を持つことがインターネット的なのではないか。

著作権法、ライセンス、などの解説や権利関係を巡るわかりやすいデザインのニーズはCCライセンスの強みだが、課題も多い。ウェブの時代にデザインされ、モバイルの時代には大幅な改修はせずに来ているが、スマートコントラクトやビッグデータ、ウェアラブルデバイスとメタバース等の世界にも適合するのか、インターフェースの課題がある。

むすびにかえて

OERの普及の現状と課題、競争法的な観点からの著作権法の読み替えの可能性、AI生成物を人間の創作物と誤認させる例の増加、音楽領域における新しさの感覚、ポストモダン系の「作者の終焉」説と生成系AIの関係など、Q&Aや懇親会では更に多岐に渡る議論がありました。

オンライン、会場でご参加を頂きました皆様にこの場を借りて感謝申し上げます。

これらも含め、今回のイベントで得られた知見やアイディアを今後のクリエイティブ・コモンズ・ジャパンの活動方針を決めて行く上での糧としていきたいと思います。今後ともクリエイティブ・コモンズ・ジャパンやクリエイティブ・コモンズ・ライセンスをどうぞよろしくお願い致します。

なお生成系AIを巡る議論については、クリエイティブ・コモンズ・ジャパン内でも議論し、後日、米国の法人であるCreative Commonsの呼びかけで開催された生成AIをめぐるコミュニティー・ミーティング https://creativecommons.org/2023/02/06/better-sharing-for-generative-ai/ でも共有しました。

なお、開催にあたっては米国の法人であるCreative Commonsの資金援助を受けました。記してここに感謝します。

(文責:渡辺智暁) 

ライセンスの執行についての資料を公開しました

クリエイティブ・コモンズ・ライセンスは、作品の自由な共有を実現することを目的としています。しかしその趣旨や許諾の内容が十分に理解されず、トラブルに発展してしまうケースもあります。

特に近年問題視されているのが、ライセンスに違反する形で作品を利用した事例において、権利者が次々と訴訟を起こす可能性を示して和解金を集めたり、実際に訴訟を起こして罰金を集める、ビジネスモデルとしてのライセンスの執行です。コピーレフト・トロール(Copyleft Trolling) とも称されるこの行為は、クリエイティブ・コモンズ・ライセンスの本来の目的から逸脱しています。もし人々がCCライセンスされた作品を利用することにリスクがあると判断し、作品を利用しない選択をしてしまうと、作品を利用してもらうためにCCライセンスで作品を提供した制作者にも負の影響を及ぼします。

訴訟とまでは行かなくても、作品の提供者と利用者間での理解の不一致によるトラブルは起こりえます。ライセンスの目的はシンプルであっても、その背景にあるのは著作権法という法律ですので規約の中身はどうしても複雑になってしまいます。規約の中身が十分に理解されないままライセンスが使われ、結果的にトラブルに発展してしまうことがあります。

このような状況を受けクリエイティブ・コモンズでは現在、CCライセンスおよびCCライセンスされた作品を、クリエイターと作品の利用者の双方が安心して使うためのベストプラクティスに関する資料や、自身の作品が意図しない利用をされた際にどのように対応すべきかに関する資料を作成しています。

現在公開されている3つの資料について日本語訳版を公開いたしましたのでぜひご覧ください。

(担当:豊倉)

オープンアクセスに大きな勝利:アメリカ合衆国が公的資金による研究をエンバーゴ(閲覧制限期間)なく自由に利用できるよう義務付け

Cable Green
Cable Green
2022年8月26日

2022年8月26日、アメリカ合衆国科学技術政策局(OSTP)は、すべての米国連邦政府機関に対し次の注目すべきガイダンスを交付しました:政府が資金提供したすべての研究およびデータについて「各機関が指定したリポジトリで、公開後のエンバーゴ(閲覧制限期間)や遅延なく」自由にアクセス・再利用できることを義務づけるようすべての方針を更新することを求める、というものです。

クリエイティブ・コモンズは、より広いオープン・コミュニティと共に、公的資金を受けて作られたリソースがデフォルトで自由に利用でき、オープン・ライセンス(またはパブリック・ドメイン)で提供されることを確保するために長らく協力してきました。私たちはこの大きなニュースを共に祝います。公衆は、公的資金の提供を受けた研究、データ、教育リソース、ソフトウェア、その他のコンテンツを自由に、公平に、そして即座に利用・再利用する資格があります。それは私たちがより良い世界を作るためにデジタル公共財を創造し共有するために必要不可欠です。このOSTPの新しいガイダンスは、そのビジョンの本質的な要素を実現するものです。

An orange open padlock icon sandwiched by the words open and access.

重要な点として、このメモが、政府が資金提供した研究へのアクセスに関する現行の12ヶ月のエンバーゴを撤廃し、さらに研究データを機械可読な形式でオープンな形で利用可能にすることが挙げられます。すべてのアメリカ合衆国の政府機関は、任意に設定可能だった12ヶ月のエンバーゴの終了を含め、更新されたポリシーを3年以内に完全に導入する必要があります。この歴史的な発表の詳細についてはOSTPのブログ記事を参照してください (1 / 2 / 3)。

これはオープンサイエンスに関するユネスコ勧告に沿ったもので、米国政府は、公共投資が公益を支えることを担保するためにオープンアクセス政策とその原則を確立した他の政府と足並みを揃えることになります。

米国政府は、病気の治療、気候変動の緩和、グリーンエネルギーの開発などのために、毎年800億ドル以上を研究資金に充てています。そしてこれは世界各国の政府でも同じです。しかし多くの場合、公的資金で行われた研究の著作権は課金制の商業ベースの論文誌に移り、支払いをしていない人がアクセスできないところに置かれ、対価を支払ったはずの国民に対して販売されます。この仕組みは常に受け入れがたいものでしたが、政府が商業ベースの論文誌に対してCOVID-19およびサル痘の研究への一時的なオープンアクセスを求める必要がある現在、それがよりいっそう際立っています。

OSTPのメモは、既存の知識へのアクセスを体系的に開放するだけでなく、新しい知識に貢献する人々の対象を拡大するよう米国連邦政府機関に求めています。SPARCに所属する私たちの同僚が説明するように、この指針は「政府が資金提供した研究の出版物やデータの、公開とアクセスの両方において、不利な背景を持つ人やキャリアの浅い人の不公平を減らす措置を取るよう機関に求めている」のです。

インクルーシブで公正かつ公平な知識を確立するための取り組みは、単なる共有を超え「より良い共有」を可能とするためのCCの戦略の中心にあります。世界の緊急性の高い諸課題を解決したいのならば、それらの課題に関する知識と、課題への貢献は開かれている必要があります。気候変動、癌、貧困、安全な水などといった課題がある中で、もしこれらに関する研究やデータ、教育資源にアクセスでき、貢献できる人が一部の人に限定されてしまっていては世界的な解決策を生み出すことはできません。

このOSTPの政策は研究へのオープンアクセスにとっての大きな勝利です。私たちは世界中のより多くの国々の政府が類似のオープンな政策を実施することを願っています。これは私たち全員が必要としている科学知識の共有モデルに向かうための重要な一歩ですが、やるべきことはまだあります。私たちが共同で作り出し、利用する知識について、単なるアクセスを超えてより良い共有へと進むためには、(1) オープンな再利用の権利を保証するためのオープンライセンスの採用、(2) コミュニティが所有し管理する公的な知識のインフラ、に取り組む必要があります。

オープンな再利用の権利

CCは20年間、オープンアクセスの方針として、研究論文はCC BYライセンスを、研究データにはCC0を、そしてエンバーゴを設けないことを呼びかけてきました。OSTPのメモはオープンライセンスについての具体的な要求はありませんが、各政府機関の計画が「出版物をデフォルトで自由に公的に利用可能にするために必要な状況または前提条件(利用権および再利用権、そして帰属の表示といった制限が適用されうるかを含む)」を記述することを求めています。良い出だしですが、政府機関のパブリックアクセスの計画が新たなガイダンスに準拠しているかを判断する ​Subcommittee on Open Science と協力し、米国政府機関がパブリックアクセスの計画を更新するにあたり、オープンライセンスと帰属の表示のベストプラクティスについて直々に支援することをCCは楽しみにしています。

公的な知識のインフラ

学術研究コミュニティと図書館が高額なサブスクリプション費用と論文掲載料(APC)に苦労する中で、コミュニティまたは学術機関が所有し維持管理を行うオープンなインフラについて、インクルーシブで公平なかたちで読む、そして投稿することへのアクセスを保証するための興味深いモデルとしてダイヤモンドオープンアクセスが出てきています。CCは最近ダイヤモンドオープンアクセスに向けてのアクションプランを支持しました。CCは、不公平で不公正な知識の制度を観察し再設計するために、行政、市民団体、研究者と連携すること、そしてオープンコミュニティを、公共の利益のために設計された新しい、公平なオープンナレッジのモデルに導くことを楽しみにしています。ダイヤモンドオープンアクセスとダイヤモンドオープン教育モデルについては今後の記事で詳述する予定です。

私たちが全ての国での完全にオープンな再利用の権利、そしてグローバルな公的な知識のインフラ取り組む中で、この重要な政策課題においてバイデン・ハリス政権が継続的にリーダーシップを発揮していることにクリエイティブ・コモンズは祝辞を述べます。CCは、OSTP、そして米国政府機関がこれからの数年をかけてオープンアクセス方針をアップデートし、実施することを支援する準備ができています。クリエイティブ・コモンズからの支援についてはオープンナレッジ担当の Dr. Cable Green までご連絡ください。

このブログ投稿は Cable Green による “A Big Win for Open Access: United States Mandates All Publicly Funded Research Be Freely Available with No Embargo” を翻訳したものです。

(担当:豊倉)