科学

Nature Publishing GroupがCC0で45万点以上の出版データを公開

Ideal Knot final rendering / Matt Biddulph / CC BY-SA

Ideal Knot final rendering / Matt Biddulph / CC BY-SA

2012月4月4日、Nature Publishing Groupは、新しいLinked data(データをオープン化するためのデータの共有方法)のプラットフォームを始めることを発表しました。 これにより、2000万点ものリソース・ディスクリプション・フレームワーク(RDF)のステートメント へのアクセスが可能になります。この中には、NPGが1869年の創刊以来発行してきた45万点以上もの記事の主要なメタデータも含まれています。また、これらのデータは、NPG特有のオントロジー(メタデータを各文書に加え、それを記述する用語を定義する構造)と同様に、基本的な引用情報(タイトル・著者名・発行日など)も含有しています。そして全てのデータは、記事をパブリックドメイン化するために、CC0のライセンスの下で公開されています。CC0はライセンスではありませんが、作品に生じる(存在する)著作権とデータベースに関する権利の放棄を永久的に望むなら、誰でも利用できる法的手段です。つまり、CC0の利用によって、可能な限り作品をパブリックドメインに近いものにできるのです。

今回の動きは、NPGが2009年に発行した数ある記事の中でも、特にこの意見記事「データとツールを取り巻く今後の出版物の共有について」で述べられている内容を実行に移した、非常に素晴らしいものです。その記事内容は、オープン共有とデータをパブリックドメインとする際のCC0の利用を、明確に推奨したものでした。

データへの自由なアクセスと利用を目的に、大規模な公共データベースがデータを公開するというのは、ごく自然なことです。しかし、この場合、利用に対する制限は非常に少なくなければなりません。そこで、私たちが支持するのは、曖昧な部分のないオープンな共有の仕方を推進することです。データをパブリックドメインとするため、いかなる権利も保持しないとするクリエイティブ・コモンズのCC0がその1つの解答です。

NPGの他にも、多くの組織や機関がデータ公開のためにCC0を利用しています。私たちのwikiページ、データとデータベースに関するCC0の利用で詳細が述べられていますので、興味ある方は是非ご覧ください。また、データに対するCCライセンスについては、http://wiki.creatibecommon.org/Data 内の記事とCCのFAQをお読み下さい。

原文: Nature Publishing Group releases publication data for more than 450,000 articles via CC0
http://creativecommons.org/weblog/entry/32283
公開日時:2012年4月5日
BY Jane Park (Communications Manager)

Safecast:ガイガーカウンター・ネットワーク

safecast

セーフキャストは、2011年3月の福島第一原発事後の直後、自分たちの身の回りの放射線量をより正確に、細やかに把握したいという人々のニーズから生まれた放射線測定ネットワークです。集められた放射線データは、誰もがアクセスできるよう、CC0のパブリック・ドメイン下でインターネット上に公開されています。2012年1月時点で、8ヶ月間で約125万個のデータ・ポイントを集め、CC0ライセンスにて6枚(日本語版3枚)のマップを提供しています。

放射線量データは、セーフキャストのウェブサイトでマップや生データの形でみることができます。ヤフージャパンの放射線情報でも、セーフキャストと慶応大学の地球環境スキャニングプロジェクトが共同で収集した固定測定器のデータによるマップが参照できます。データ測定には、移動・固定両方の測定器が使用されていますが、センサーを統一することでデータの整合性が保たれるようになっています。

セーフキャストは、福島原発事故後から一週間後、アメリカや日本に滞在していた発足メンバーたちの放射線情報の不足についてのメールのやり取りから誕生しました。放射線測定器の技術面やマッピングなど、さまざまな専門性を持った人たちがインターネットを通じて集まり、Kickstarterを通じたキャンペーンで当初の運営資金を確保しました。現在、セーフキャストの測定器の開発やウェブサイト、データベース構築、実際の測定など、さまざまな面で Tokyo Hacker Spaceのメンバーをはじめとする100人超のボランティアが活動しています。放射線量マップの範囲は世界に拡大する計画で、日本以外での計測もすでに始まっています。

セーフキャストのすべての生データはCC0のパブリック・ドメイン下にあり、その他の写真や文章などのコンテンツはCCBYNC下で利用可能です。

参考:

・米クリエイティブ・コモンズのブログ記事(英語) http://creativecommons.org/weblog/entry/30627
・20118月に東京で行われたセーフキャストのイベント動画 http://www.ustream.tv/recorded/16459403
・セーフキャストのデータがCC0で公開されている理由について http://blog.safecast.org/ja/2011/09/the-legal-versus-ethical-reasoning-behind-using-cc0-for-safecast-data/
・セーフキャストについてのラジオインタビュー(英語、テキストあり) http://spectrum.ieee.org/podcast/geek-life/hands-on/crowdsourcing-radiation-monitoring
・Vimeoのセーフキャストの動画ページ http://vimeo.com/safecast/videos

生命科学系データベースアーカイブ


生命科学分野においては、データ・情報の円滑な再利用が課題となっています。これには様々な問題がありますが、とりわけ、データの所在や利用条件がわかりにくく、利用者が使いにくいと感じている点や、研究プロジェクト終了後はデータベースが維持されないといった点が指摘されていました。

ライフサイエンス統合データベースセンター(DBCLS)生命科学系データベースアーカイブは、上記のような問題に対応するためにクリエイティブ・コモンズ・ライセンス CC BY-SAを標準利用許諾として採用しました。

生命科学系データベースアーカイブがCC BY-SAを採用した背景には、データベース寄託者のクレジット確保という要望に応えることができる一方、データベース利用者にとってはデータ利用条件や権利者が明確になり許諾の確認コストの軽減を狙っているとのこと、さらに、派生物を公開するときには、同様に自由に利用できるライセンスであることが望ましいという考えがありました。

生命科学系データベースアーカイブには簡易検索機能などもあり、データの使い勝手の良さにこだわった作りになっています。このサービスが広く皆様に利用され、生命科学の発展の一助となれば、私たちCCJPにとってもこの上ない喜びです。ぜひご活用ください。

理研サイネス

理研サイネス(SciNetS : Scientists’ Networking System = 科学者達の連携網システム)は、理化学研究所の生命情報基盤研究部門が開発・運用している、共同研究のための生命科学データベースです。
このデータベースは、複数のバーチャルラボが並存する、いわゆるクラウド型のウェブシステムです。各研究者が連携してデータベースをセキュアに共有できるため、国際連携研究を進めるための基盤としても利用されています。

個々のバーチャルラボでは、さまざまなコンテストの開催や、オープンイノベーションも企画されています。
例えば最近では、「GenoCon」というゲノム設計のオープンイノベーションが、コンテスト形式で開催されています。生物の性質を決める遺伝情報は、DNAデータであるゲノム情報となるわけですが、このゲノム情報を設計することで、ある生物に新たな機能を付与したり、既存の長所を更にのばしたりすることが期待できます。GenoConの参加者はバーチャルラボでDNAデータを設計して提出し、安全基準を満たしている設計のみを専門家が選んでさらに実験的に評価します。このように、設計と実験を明確に分離することで安全性に十分な配慮がなされているため、「GenoCon」には高校生部門も設けられています。そして、「GenoCon」によって蓄積されたゲノム設計の手法やプログラムは、CCライセンスBY-SAを付して共有され、最良のゲノム設計のためのデータリソースとして役立つこととなります。

このように、ゲノム研究の進歩のためには、既存の研究から得られた膨大なデータを研究者が共有することが必要と考えられており、理研サイネスのようなデータベースは不可欠の存在でしょう。こうしたデータベース構築の際のデータライセンスは、パブリックドメインとされることもありますが、「設計」のような創作性の高い知的活動によって生み出されたDNAデザインは将来的に著作権が主張されることも十分ありうるため、今のうちからそれらの集積・統合・共有に際して明示的に、氏名表示・継承といったCCライセンスを適用して共有していく意義は大変大きいといえます。CCライセンスに準拠して情報共有を行える理研サイネスの今後の動向にも注目です!

関連エントリ:理研のデータベースがCCライセンスも適用可能な形で公開

Science Commons

Science Commonsは、学術・科学情報分野における情報共有や研究活動のオープン化を進めることを目的とした、クリエイティブ・コモンズの派生プロジェクトです。つぎのプロジェクトを中心とした活動を行っています。

  • Scholar’s Copyright Project:研究者が学術誌へ論文を投稿する際、著者自身がCCライセンス等の条件でウェブ上で公開することが可能なことを出版社に確認するための契約書フォーマットを提供しています。また、学術出版社によるCCライセンス採用を進めるための取り組みも行っており、実際に2008年末時点でPLoS(Public Library of Science)やHindawiをはじめとする、1000以上の学術誌がCCライセンスによる学術論文の公開を行っています。
  • Biological Materials Transfer Project(MTA):DNAや抗体といった、生命科学分野に関する研究マテリアルの企業や大学間での相互利用を促進するための取り組みを行っています。
  • Neurocommons:生命科学分野におけるオープンソースの総合的知識マネジメントツール(データ解析、テキストマイニング等)の構築を進めています。
  • The Health Commons:医薬品開発のオープン化・開発モデルの改善を進めています。

2009年からは日本における活動の浸透と拡大のため、有志による日本語化プロジェクトも開始されていますので、ぜひご覧ください。

統合TVで動画にCCライセンス付与を推奨

統合TVとは、科学データベースやツール等の使い方を動画で説明するサイトで、ライフサイエンス統合データベースセンター(DBCLS)が発信しています。

例えば、PubMedという医学・看護学・歯学・獣医学・ヘルスケア・臨床科学の分野での文献データベースの利用方法からCamtasia Studioを用いた動画の撮影・編集方法まで、オンライン上でアカデミックな作業をする際に役立ちそうなTipsが集まっています。これらの動画はCC-BY-SAライセンスで公開されています。

この中で、CCライセンスの付け方についても動画を掲載していただきました!是非ご覧下さい。

http://togotv.dbcls.jp/movie/100218cc_f.html

Public Library of Science

Public Library of Scienceは革新的な7つのジャーナル出版者で、科学ジャーナルをウェブ中心に再考するものです。特にPLoS BiologyやPLos Medicine、PLoS ONEなどが有名。全てのPLoS内のコンテンツはCCのBYライセンスで公開されています。

PLoSに加え、現在では数百もの学術ジャーナルがCCライセンスの下で公開されており、学者や教育者、一般人の知識へのアクセスが増え、よりイノベーションを容易にしています。10月に行われたシンポジウム「科学における情報の上手な権利化と共有化」での議論や、Science Commonsにおける取り組みなど、学術分野におけるCCライセンスの活用が広がっていくことが望ましいのではないかと思います。