TOP > 大会・研究会等 > 研究例会 > 2005年度 > / Update: 2006.1.9

日本図書館研究会研究例会(第231回)報告


日時:
2005年12月20日(火) 19:00〜20:45
会場:
大阪市立弁天町市民学習センター
発表者 :
足立潔(国立国会図書館関西館)
テーマ :
国立国会図書館におけるネットワーク系電子情報への取り組み
参加者:
15名

1.ネットワーク系電子情報と国立国会図書館

 2000年10月施行の国立国会図書館法改正で、パッケージ系電子出版物が新たに納本対象となったが、ネットワーク系電子出版物は当面対象外とされた。
 2002年、ネットワーク系電子出版物の取扱について納本制度審議会へ再度諮問を行った。また同時期に「電子図書館サービス実施基本計画」を策定し、2002年後半から実験事業WARP、Dnaviが立ち上げられた。その後2004年2月に策定された「電子図書館中期計画」ではオンライン系情報資源の収集を含むデジタル・アーカイブ構築等が目標の一つとして掲げられている。こうした中で2004年12月に出された納本制度審議会答申「ネットワーク系電子出版物の収集に関する制度の在り方について」では、既存の納本制度には組み入れずに、別途国内のインターネット情報を制度的に収集できる法制度の整備が提言された。

2.WARP(Web ARchiving Project)

 正式名称は「インターネット資源選択的蓄積実験事業」で、いわゆるウェブ・アーカイビングを行うものである。米国のInternet Archiveのように包括的収集ではなく、著作権者との契約に基づく選択的収集を行っている。
 2005年11月現在、合併前の市町村1,529件や旧国立大学75件、イベント関係26件など既に消滅したり大きな改変があったりしたサイトを保存しており、最近は政府関係サイトも増えつつある。また、電子雑誌も1,419タイトルを保存している。総サイト・タイトル数は3,260件、収集ファイル数は3,500万を超えている。
 収集対象の発見は、推薦の仕組みもあるが、職員による探索が主となっている。新規収集時には許諾依頼作業を行い、回答に基づいて収集条件を設定する。収集条件は、収集範囲(ドメイン単位からファイル単位まで対応)と提供条件(公開時期、公開範囲)である。WARPに関わる著作権としては複製権、同一性保持権、公衆送信権があり、それぞれ許諾時に明確にしている。
 組織化単位はサイトまたは電子雑誌のタイトルであり、その下に収集日単位の「個体」が位置づけられる。メタデータはDublin Core準拠の「国立国会図書館メタデータ記述要素」に則って作成している。
 今後の課題としては、収集対象の発見や品質管理(収集物の確認)がもっぱら職員の手作業でマンパワーの限界があること、収集ロボットの機能による技術的制約があること、著作権者との許諾手続に時間を要していること、等があげられる

3.Dnavi(Database Navigation Service)

 主として国内に置かれているウェブサイト上に存在するデータベースを、メタデータとリンクによって案内するものである。WARPのロボット収集は検索時等にページが動的に生成される「深層ウェブ」には無力であり、そうした情報へのナビゲーションを企図している。
 自治体が公開している議事録・例規・公文書等のデータベースや大学・学術団体の公開データベース、貴重書・特別コレクション・電子雑誌・記事索引など、2005年11月現在で約9,000件を収載している。
 対象の発見は職員による探索が主である。登録時にはリンク依頼メールを発信している。メンテナンスとして、リンク切れになったURLを自動抽出して手動で確認するデッドリンク処理を行っている。原則として可能な限り小さな単位を組織化単位とし、WARP同様「国立国会図書館メタデータ記述要素」に沿ったメタデータを作成している。
 今後の課題としては、「データベース」として扱う範囲を再定義して収載基準を明確にする必要があること、職員の手作業に頼る収集対象発見に限界があること、館内外の同種のサービスとの協調・連携が求められること、等があげられる。7月にプロトタイプが立ち上がった「NDLデジタルアーカイブポータル」とのOAI-PMHによる連携を計画中である。

4.NDLウェブアーカイブ

 2004年の納本制度審議会答申を受けて、2005年には館内に「制度化推進本部」を設置し、法制化に向けた検討を行っている。4月に制度化基本方針を発表し意見募集を行ったところ、様々な意見が寄せられた。それらも踏まえて6月に基本方針改訂版を公開している。
 基本方針改訂版では、包括的自動収集は公共性の高い機関を対象とすること、事前に収集時期・方法等について公告すること、収集拒否・消去・提供拒否を認めること、利用制限措置の仕組みを持たせること、等があげられている。公共性の高いサイトとしては、国等(go)、地方自治体(lg等)、教育機関(ac, ed)、公益法人等(or)を考えている。また、事前の「公告」では収集の技術的方法、収集対象サイトの範囲、収集時期、拒否・消去申出方法、ロボット排除設定方法、等を明らかにする予定である。現在、システム構築に向けて収集ロボットの調査などを行っている。将来的にはWARPとの統合も視野にあるが、フォーマットの移行やメタデータの扱いが課題である。

発表後、収集範囲、収集ロボット等の技術的側面、著作権、今後の見通しなど活発な質疑が行われた。

(記録文責:渡邊隆弘)

<参考>
WARP http://warp.ndl.go.jp/
Dnavi http://dnavi.ndl.go.jp/