デジタルアーカイブの連携に関する関係省庁等連絡会(第2回) 議事概要

日時:平成28年1月15日(金)10:00〜12:00
場所:中央合同庁舎4号館 108会議室

【議事】

  1. デジタルアーカイブ構築に係る課題検討
    • (1)アーカイブ機関の連携のためのメタデータ標準化に係る課題について
    • (2)地方のアーカイブ機関の現状と課題について
    • (3)日本型アグリゲーターの役割・機能について
  2. アーカイブ利活用促進に向けた制度整備の状況について
    • (1)メタデータ・サムネイル/プレビューのオープン化について
  3. 課題整理のための各分野の状況確認について
  4. 今年度の成果報告の取りまとめについて
  5. その他
    • (1)関連する研修・イベント等について

【概要】

1.デジタルアーカイブ構築に係る課題検討
(1)アーカイブ機関の連携のためのメタデータ標準化に係る課題について

○国立博物館、高野座長より資料1−1及び資料1−2、杉本構成員より資料2に基づき説明。

○質疑の内容は、以下の通り。

(高野座長)
メタデータを決めるということは記述の対象を決めるのとほぼ等価。そういう意識を持ってメタデータを作るべき。記述単位ごとにばらしてアーカイブをつなぐこともあり得るため、アーカイブごとにローカルタームで書かれているとつなげにくい。標準的なルールに基づいた記述単位の選び方や、それに対する情報の付与があった方がよい。
メタデータを引き出す方式として、技術的にはSPARQL等があるが、最少の参照単位の決め方等の仕掛けも含めて提供者側が行うようになっている。これからは、参照単位のレベルを変えながら提供できるようになっていくだろう。そうすると、一つのアーカイブに対して、色々な参照単位でアーカイブを外から見られるようになる。
メタデータは誰のために誰が付けるものなのか。元々物を持っている人だけが優先的なポジションにあるのではなく、使う側がメタデータを作る方が、どういうメタデータにすればアーカイブがより活きるか分かるのかもしれない。そういった自由度を開いていくことが今後のトレンドとして重要ではないか。
(秋田県立図書館 山崎副館長)
資料1−2には、複数のアーカイブを結ぶための技術が3点示されており、参考になった。それぞれのメリットやデメリットがあれば教えてほしい。
(筑波大学 杉本教授)
SPARQLが一番新しいもので、これから色々なところで増えていくと思う。SPARQLは個々の対象をURLに置き換えて指定できる。
例えば、国立国会図書館の「ひなぎく(NDL東日本大震災アーカイブ)」もSPARQLが基礎としているRDF形式をベースにメタデータが作られている。今はOAI-PMHでメタデータをやり取りしているが、SPARQLのデータベースに置き換えてサービスすることになっても、うまく移行できるのではないかと思う。
資料1−2の項目も記述もテキストであるが、テキストというのは文字列のマッチングでしかない。それがどのもの・ことなのかの識別の仕方がURI(Uniform Resource Identifier)に置き換わっていくことによって、もの
ことが一意に決められる。様々なサービスがこれまでテキストベースでつながってきていたが、LOD(Linkd Open Data)なりOAI-PMHなり、つながり方がテキストベースからURIを使用したリンクベースに変わっていく。それが今後の一番の大きな進歩であると思う。
(国立国会図書館 大場課長)
国立国会図書館サーチとひなぎく(NDL東日本大震災アーカイブ)では、横断検索とメタデータハーベスティングの両方を使っている。横断検索は、それぞれの機関がメタデータをコントロールしやすいメリットがある一方、検索速度が相手側に依存するデメリットがある。メタデータハーベスティングは、データを受け取った後の操作が容易というメリットがある一方、作成元がデータを更新する場合にタイムラグが生じるデメリットがある。
SPARQLやLODは、まだ取組を始めたばかりで何とも言えないが、国立国会図書館で行っているのは「典拠」と言われる情報。例えば、人物にURIを振って特定可能にする。また、「件名」と呼ばれる分野ごとのキーワードについて概念にURIを振る、といったことを始めている。
(知財事務局 中野補佐)
メタデータの標準化について、本日は現状と課題の共有ということで、皆様からご紹介いただいた。選択肢がいろいろある中で、現実的な解として異分野のアーカイブを連携していくにあたっての選択肢があれば、ご紹介いただきたい。
(国立国会図書館 大場課長)
まず、メタデータハーベスティングの部分で比較的シンプルなレベルの項目で共有するところが実現できれば効果が出るのではないか。最終的にはLODのように概念のレベルで照会できるようになれば色々な活用ができると思うが、いきなり目指しても難しい。どんなものがあるのかメタデータを一覧できるようにするところから始めて、次に人物情報の共有など、段階的に共通化していくのが良いのではないか。
(高野座長)
大場課長の意見に賛成。全体が一気に良い形に変わるのは非現実的。速度が違っても大きなアクティビティに参加できるようにしていくような仕掛けづくりとして、横断検索でヒットするものを提供するのも、メタデータをうまく提供するのも、自分の持っているアーカイブの単位を見直してデジタルに適合したものを提供し直すのも、いずれも参加の仕方の一形態。それぞれ並行して進められるものと捉えるべきではないか。
(筑波大学 杉本教授)
メタデータハーベスティング、LODどちらでもよいが、Web上でのデータの共有がしやすい形でURI、識別子を大事にすることは重要。
もう一つは、それぞれのアーカイブは自由にやりたい、メタデータを集めるところはコントロールしたいという両者の間のつなぎを如何にやっていくか。また、自由にやりたいというのも、自分たちは標準を知らないから自由にやる、ということが多いのでそうならないように気を付けないといけない。

(2)地方のアーカイブ機関の現状と課題について

○国立近代美術館より資料3、山崎構成員より資料4に基づき説明。
○質疑の内容は、以下の通り。

(筑波大学 杉本教授)
秋田県には、かまくらや竿燈のような祭りがあるが、これらの記録をコレクションの中に入れていくということは行っているのか。
(秋田県立図書館 山崎副館長)
秋田県デジタルアーカイブには、図書館でデジタル化した祭りの動画を入れている。それから、民話のデータも音声で入れている。
(筑波大学 杉本教授)
質問した理由は、最近ではデジタルで簡単に画像、動画を撮ることができるので、はじめからデジタルで撮っておけば、そのままデジタルコンテンツとして増やしていくことができる。毎年続けていけば、地方における将来の大きな資産になるのではないか。
(高野座長)
秋田県デジタルアーカイブでは、メタデータ、サムネイル、コンテンツ等の利用のための仕組みとしてどのようなライセンスで提供されているのか。
(秋田県立図書館 山崎副館長)
ライセンスの許諾は各機関で取っている。著作権処理が済んだものや権利が切れたものを掲載している。そのため、画像はなくメタデータだけのものもある。
(高野座長)
例で載っているのは著作権が切れているもの。著作権法上は、利用に関して問題ないと思うが、たいていのサイトには、利用する際のお願いのような文章が書いてあり、皆がそれを守ろうとするので、なかなか活用が広まらないという現実がある。それについてどう考えるか。
(秋田県立図書館 山崎副館長)
画像はスクリーンショットのみ可能で、ストリーミング配信なので直接ダウンロードはできない。高精細な画像や動画を使用したい場合には別に申請をしてもらって提供している。
(高野座長)
あまり皆に使ってもらいたくない、高精細なものが世界中に流布されるのは避けたいということか。
(秋田県立図書館 山崎副館長)
使ってもらって構わないし、実際に数か国からオファーも来ている。ただ、海外からの利用申請だと対応が大変だし、画像を公開するメリット
効用がよくわかっていないため、公開に消極的な機関もあるようだ。仕事が増えるだけと捉え来館が増えることまで結びつけて考えられていないのではないか。
(高野座長)
許諾しないと利用できないことにするから事務が発生するのであり、自由に使ってよいことにすれば事務が発生しないが、なかなそうはいかないということか。
(東京国立博物館 田良島課長)
見落とせないところは、大容量画像のメンテナンスが大変であること。最近では180MBくらいの画像を何万枚と管理しているが、リアルタイムで提供するとなるとサーバーの管理が非常に大変であり、その分のコストが大きい。
高精細画像を直接に提供するとなると、提供館としては非常に負担が重い。よって、ワンクッション置いた提供、つまりプレビュー画像を一段階置いた形の提供にしないとあまり実践的な話にならない。
(高野座長)
提供館がサーバーを立ち上げて維持するとなると大変。例えば、国立国会図書館に入れておけば、原画像は国立国会図書館のリッチなリソースを使うことができ、誰がどういう目的でということを申請登録するようにすれば事務手続も機械的に行われ、利用が広がる、といったことはできないか。そこで何か突破口が開ければ面白い。フランス国立図書館(BnF)などは何でも自由に取ってこられる。そういったところに一部だけでも置いておけるようになればそれがインセンティブになるのではないか。

(3)日本型アグリゲーターの役割・機能について

○国立国会図書館より資料5、生貝構成員より資料6に基づき説明。
○質疑の内容は、以下の通り。

(高野座長)
Europeanaのようにヨーロッパの多数国を纏めるのに比べれば、日本のほうが簡単に進むはず。今回かなりのプレーヤーが揃う中、夢を出してもらって、最大公約数となる方向性を国や自治体に支援してもらえるようもっていきたい。
(東京国立博物館 田良島課長)
EuropeanaとDPLAは、基本的にはメタデータアグリゲーターだと思うが、アグリゲーターがデータの権利処理まで踏み込んでやっているケースはあるのか。
(東京大学大学院 生貝特任講師)
アグリゲーターによりけり。技術的支援、人的支援など様々なことを行う中で、アグリゲーターの支援プログラムとして権利処理まで手伝うことはあり得る。しかし、基本的には各館がやることになっているかと思う。
(東京国立博物館 田良島課長)
日本の場合、各館の体力からみるとアグリゲーターに権利処理までやってほしい、というところが圧倒的に多いという気がする。
(高野座長)
EuropeanaのアグリゲーターのLoCloudや、前回報告のあったニュージーランドのDigital NZで図書館が取り組んでいるような、各地方館からデータを拾い上げるためのソフトウェアやプラットフォームを作って提供するといったアプローチも必要ではないか。
(秋田県立図書館 山崎副館長)
国がどういった支援をするかということだが、データ作成は各館がある程度やらなければならない。問題はそれを公開したり、アグリゲーターに提供したりする費用について自治体で予算を持つことができない。秋田県のデジタルアーカイブも国立国会図書館サーチにリンクを貼るのに半年ほどかかったように、簡単なようで、意外と難しい。そこに金銭的、技術的支援がないとなかなか進まない。
(高野座長)
Europeanaの本部で聞いた話によると、個別館が自館公開のために作っているデータや力のないアグリゲーターの場合、とてもEuropeanaのデータタイプとのマッピングはうまくいかない。彼らに任せても何も進まない。このため、個別館等によってはAs-Isでそのままメタデータを受け入れ、マッピングの操作も含め後は全部本部に任せるようにしていることもあるようだ。
システムについては本部のエンジニアスタッフも弱いので、ピサ大が連携している。大きいデータの取り込みについては、丸ごとピサ大に投げて処理してもらって、メインのデータベースに反映させている。
このように、Europeanaは国や大元のデータの所有権を超えてやっている。それもCC0とかCCBY等のルールがあるからこそできるのではないか。
前回、水谷室長から、これだけ目録があって、これだけ整理もしたので、後はルールを工夫すれば、それが電子化されるだけでかなり行けるという話があり、非常に勇気付けられ、鉱脈を見つけたような印象を受けた。
(東京国立近代美術館 水谷室長)
資料7の図は良い。美術館が作ってきたメタデータをオープンにできるか、また、その意思を各館が持てるかと、サムネイルが著作権フリーで出せるかというのは、大きな問題。これをクリアすることができれば状況は大きく変わるだろう。
美術館と図書館とを丁寧に関係付けていく必要がある。全国美術館会議でも議論しているが、文化遺産オンラインが国立国会図書館サーチと連携することをなるべく早くメッセージとして出すということが重要。そのためには、メタデータとサムネイルは今後オープンに向かっていくことを前提とする必要がある。
全国美術館会議は、毎年3月に学芸員研修会を実施しており、今年は著作権について取り上げる予定。

2.アーカイブの利活用促進に係る課題検討
(1)<メタデータ・サムネイル/プレビューのオープン化について

○国立国会図書館より、資料7に基づき説明。
○質疑の内容は、以下の通り。

(高野座長)
どういうところが担っていくか、どういったアグリゲーターの関係性の中で作っていくかという点も含め、最終的にそこでできてくるもの
(メタデータ、サムネイルなど)
について、我が国としてどういったルール付けが望ましいかについて、議論いただきたい。
(筑波大学 杉本教授)
メタデータに関する権利管理を含めておけというのはLODの世界でもよく言われており、サムネイルも含めどういう使い方ができるのかを入れておくことは重要。
EuropeanaにせよDPLAにせよ、アグリゲーションするということは、これらのサービスに向けて行っていることなのか。つまり、アグリゲーションは(EuropeanaやDPLAを頂点とした)ヒエラルキーの一部に必ず入るものなのか、それともネットワーク的にアグリゲーションした結果を使えるものなのか、考え方によって変わってくる。
(高野座長)
おそらくヒエラルキーである必要はない。例えば、DPLAとHathiTrustとでは、後者が圧倒的に有名でユーザーも多い。ただし、DPLAはデジタルヒューマニティという目的意識の下で集約している。アグリゲーションは、どこで使われるのかというコミュニティも含めての塊と捉えている。
(国立国会図書館 大場課長)
その考えで良いと思う。アグリゲーションというのは、国立国会図書館サーチに提供するためのアグリゲーションではないのだと思う。例えば、美術館であれば、美術館の間で所蔵情報を融通するとか、美術品を研究者にいかに使ってもらうか、というような観点でのアグリゲーションが必要。そのためにメタデータ利用を自由化した方が良い。その結果として国立国会図書館でも使える、という流れができていくことが必要。
(高野座長)
集めたものは国民全員が同じ条件で使え、その一ユーザーとして国立国会図書館サーチが立つという意義付けになるのではないか。一方で、一つの目線、観点でメタデータが統一的に作られるのは非常にメリットがあり、国立国会図書館サーチはその共通化・標準化の主体になるということかと思う。
(東京国立近代美術館 水谷室長)
基本的にはそういった考えで進むのが良いと思うが、日本の場合、美術館と図書館の親和性はそれほど高くない。秋田県、徳島県、三重県等のように、公立美術館とそれぞれのコミュニティにおける図書館とが上手く連携ができている県もあるが、それぞれが遠い存在である自治体もある。そういった各県の情報をどのように把握するかもこれからの課題。
(高野座長)
文化庁でも文化遺産オンラインのプロジェクトで博物館等のデジタルアーカイブ化支援事業として、所蔵品データの管理・検索ができるデータベースを利用できるということを実施している。
(文化庁伝統文化課 大谷課長)
高野座長にも関わっていただきながら、まさに今作業しているところ。
(高野座長)
データを提供することで何か自分たちに返ってくるようになっていないと、単にデータを吸い取られてしまう印象になる。自分たちでも使えるようにしつつ信頼感の持てるパートナーになっていけると良い。
(東京国立博物館 田良島課長)
重要なのは、博物館同士、館の間でのメタデータの流通というのが実は一番インセンティブが大きいということ。
東博だけでも年間100館以上に所蔵品を貸し出しているが、その度にいろいろな事務が発生していて、中には画像の提供や作品サイズの確認などメタデータを使わないと話が進まない作業が結構ある。
以前、図書館にILL(Inter-Library Loan:図書館間相互貸借)があるように博物館にもIML(Inter-Museum Loan)があってよいだろうという話をしたことがある。作品の貸し借りにおいて発生している煩雑な業務がメタデータの流通・共有で解消されるのであればそれは一つのインセンティブになると思う。
(東京大学大学院 生貝特任講師)
田良島さん、水谷さんの発言に関連して、Europeanaでの連携は、地域毎の縦軸と館種別・テーマ毎・分野毎の横軸でやっていることを前回紹介したが、たとえば博物館であれば無理に地域でまとめるより、博物館分野のアグリゲーターが集めたほうがやりやすい場合もある。一方で、地域の小さい文化施設まで把握している自治体が集めたほうがやりやすいこともある。連携のための入り口を一つに絞ってしまわず、個別の文化施設とアグリゲーターの双方がやりやすい形で連携を進めてもらっているのがEuropeanaの現状。
杉本先生が発言された点について、EuropeanaやDPLAはヒエラルキー構造というよりはまさにネットワーク構造であると思うが、基本的な目的はディスカバリー(情報の発見)の連鎖。Europeanaにデータを集約しておくということは、例えばヨーロッパの中にモネはどこにあるか、というような時にまずはEuropeanaからアグリゲーターに辿り着く。さらにメタデータを辿って本当の所蔵館に辿り着くというディスカバリーの連鎖というのが基本的な目的である。
そういった構造がないと、インターネット上にいくらデジタルアーカイブを公開しても、Googleを使わないと辿り着けないことになってしまう。もともとEuropeanaが作られたのも、ヨーロッパの保有する膨大なデジタル文化遺産へのアクセス経路が、事実上Googleという一企業のアルゴリズムに独占されつつあることへの危機感がひとつのきっかけだった。文化の多様性と自律性を尊重した、デジタルアーカイブへのアクセス向上のための連携構造をいかに作るか、ということが基本。
(高野座長)
博物館のIML構想をぜひ実現したい。図書館でOPAC(Online Public Access Catalog: オンラインで検索可能な蔵書目録)が整備されたのも、学術情報センターが設立されたのも、ILLのためのインフラとなるデータベースを作るためだった。
(筑波大学 杉本教授)
ILL、IMLも面白いと思うが、両者は利用者のモデルが違う。ILLは図書館を利用する個人で、IMLは展示を行う博物館・美術館の学芸員が利用者になるだろう。Europeanaの話でもアグリゲーションの部分で、利用者の利用モデルがどのような形で入ってきているのかが見えない。どのように使うのかを考えないと実際のところはアグリゲーションできないのではないか。
(東京国立博物館 田良島課長)
それはそのとおり。博物館では長年写真の利用は特別観覧という扱いで、展示を見る行為の代替としている。そういう意味ではIMLの話とは別物のこともある。
アグリゲーションというと、一つのシステムに集めてそれを検索すればよく、そこに情報を吸い上げられるというイメージを持たれてしまうのは良くない。
(高野座長)
自館が持っているデータの流通性を高めることで利用が増える、という解釈が可能な仕掛けを考えることが必要。
杉本先生のご意見としては、機械処理に適した形で集めたからといって新しい利用が自動的に生まれるものではないということかと思う。Europeanaも利用件数はGoogleに満たない状況で、今後どういった利用の局面を作っていくかが課題となっている。その中で、各国や各分野が新しい利用の方法を提案し、それに対してファンディングして先進事例を蓄積していこうとしている。
これまでは集める人と利用する人が一緒だったが、これからは役割を分けて、利用の専門家に利用してもらうことで集めたデータの価値が高まるのではないか。
サムネイル画像について、許諾なく使用できると言ってしまうのは、著作権法上問題があるか。
(文化庁著作権課 俵著作物流通推進室長)
現行の著作権法では、サムネイル画像をインターネット送信するには許諾が必要。昨年度の審議会において、権利者の利益にも配慮しつつ、こうした行為を可能とすることについて検討すべきとされており、現在関係者の意見を聞いて調整しているところ。
権利者の中には、サムネイルを紹介することで美術品を見てもらえる機会が広まるので良いという方もいれば、サムネイルであっても使われることに懸念を抱いている方もいる。
具体的には、海外ではどのような仕組みになっているのか、使えるようになった場合には補償金のような形で一定額を還元する仕組みを作れないか、サムネイル画像のサイズや精細度や対象となる施設等はどのように決めるのか、等の意見が出てきている。
サムネイル画像のインターネット送信を権利者の許諾を得ずに可能とすることについて、今年度中に関係者の意見を整理する予定。関係者の意見を踏まえて具体的内容について検討を進めると言うことになると思うが、本協議会とも連携していけると良い。
(高野座長)
本質的な解決までは少し時間が必要ということだが、情報の整理のために、確認したい。サムネイル自身を整理する方々のコミュニティの中でクローズドに公開することについては問題ないか。
(文化庁著作権課 俵著作物流通推進室長)
インターネットで皆に見てもらえる形でアップロードする場合には許諾が必要。公開する範囲によって異なってくる可能性がある。
(秋田県立図書館 山崎副館長)
サムネイルだけを作ることはほとんどなく、画像そのものをデジタル化すると思うが、デジタル化の際には許諾は必要なのか。
(文化庁著作権課 俵著作物流通推進室長)
保存のためにデジタル化して複製するという行為については、昨年6月に対象施設の範囲を拡大し、博物館法の登録博物館と博物館相当施設が可能となった。一定の条件はあるが、私立も含めた大部分の美術館、博物館、図書館は保存のための複製ができるようになったといえると思う。
(秋田県立図書館 山崎副館長)
震災アーカイブ等は地域のNPO等で行っているところも多いが、NPOになると難しいのか。
(文化庁著作権課 俵著作物流通推進室長)
私立の美術館や博物館の場合、博物館法の登録博物館や博物館相当施設であっても、運営主体が株式会社となっているところは複製できないが、公益法人であればできる。登録博物館にも博物館相当施設にも該当しない施設は、今回の改正で新たに対象になるものではない。現在対象となっていない施設については、個別に指定するかどうかを検討することになる、

3.課題整理のための各分野の状況確認について

○知財事務局及び国立国会図書館より、資料8に基づき説明。

4.今年度の成果報告の取りまとめについて

○知財事務局より、資料9に基づき説明。

5.その他
(1)関連する研修・イベント等について

○国立国会図書館より資料10−1、総務省より資料10−2に基づき説明。
○次回の実務者協議会は、3月10日に開催予定。

(筑波大学 杉本教授)
(資料10−2の)DANワークショップに関して、先程から利用者のことを考えてほしいと話してきたのは、この取組みでの経験からきている。これまでデジタルアーカイブの有効性をエンドユーザーまでどのように伝えていくかが十分にできておらず、どうしても提供者側の視点になってしまっていた。この両者をつなぐ人材育成、場の養成が大事。
関係する省庁でも一緒になって、これらを地域にどうやってつないでいけるか、ということをやっていただけるとありがたい。

以上