MLAとリンクするデータ 各国図書館の書誌・典拠グラフを中心に
- リンクするデータと書誌・典拠
- 国立国会図書館の書誌・典拠グラフ
- 国立国会図書館のモデルの特徴
- ドイツ国立図書館の書誌・典拠グラフ
- ドイツ国立図書館のモデルの特徴
- 英国図書館の書誌・典拠グラフ
- 英国図書館のモデルの特徴
- フランス国立図書館の書誌・典拠グラフ
- フランス国立図書館のモデルの特徴
- WorldCatの書誌・典拠グラフ
- WorldCatのモデルの特徴
- 各国図書館のプロパティ比較
- 原則4:さらなるリンク
- VIAFを介したつながり
- 共有の可能性と課題:プロパティ
- 共有の可能性と課題:モデル
- 共有の可能性と課題:リンクと同一性
- (参考)英国博物館のCRMグラフ
- (参考)英国博物館のCRMモデルについて
- (参考)公文書館のEADグラフ
- (参考)公文書館のEADグラフについて
- 参照先
リンクするデータと書誌・典拠
- リンクするデータ4原則
- ものごとをURIで名前付けする
- これらの名前を調べて訪ねる(参照解決する)ことができるように、
http
スキームのURIを使う - 名前付けしたURIがたどられたら、有用な情報を返す
- ほかのURIへのリンクを加えて、より多くのものごとを見出せるようにする
- 各国図書館での原則1、2:ユリシーズの場合
- 原則3:有用な情報のそれぞれ
- どの書誌URIも詳細なRDFグラフが返ってくる
- 使用語彙、RDFモデルは、試行段階でもありさまざま
- 以下では上記のURIを辿って得られるグラフを比較検討
国立国会図書館の書誌・典拠グラフ
-
- 図は書誌と典拠を併合したグラフからリテラル値を除いてノードの関係を圧縮表示したもの(簡潔に示すため一部ノードを省略)。ノードボックスの値は上からクラス、識別子、ラベル。以下各国図書館のグラフ図も同様
国立国会図書館のモデルの特徴
- 基本ノードの構成
- 管理レコード(
BibAdminResource
)→書誌レコード(BibResource
)→館蔵レコード(Item
) - 書誌レコード→著者(
Agent
)←名称典拠(Concept
) - 統一タイトル(
Concept
)
- 管理レコード(
- 語彙と特徴的な記述
- Dublin Core、SKOS、RDAなど+独自のDC-NDL
- 読みとセットにした構造化タイトル/標目
- 書誌の主要プロパティはリテラル型と実体型の両方を提供(
dc:creator
とdcterms:creator
など)
ドイツ国立図書館の書誌・典拠グラフ
ドイツ国立図書館のモデルの特徴
- 基本ノードの構成
- 書誌レコード(
bibo:Document
)→著者(gndo:DifferentiatedPerson
) - 作品(
gndo:Work
)→著者(gndo:DifferentiatedPerson
)
- 書誌レコード(
- 語彙と特徴的な記述
- 書誌はDublin Core、Biblioオントロジー、一部新RDA;典拠は独自のGNDオントロジー中心
bibo:authorList
で著者順序を表現- 著者典拠はリテラル標目(
gndo:preferredNameForThePerson
)と姓名を分けた構造化標目(gndo:preferredNameEntityForThePerson
)を併用 - 作品、著者はGND(名称典拠)のIDによるURIを持つけれども、モデル上は実体に相当
英国図書館の書誌・典拠グラフ
英国図書館のモデルの特徴
- 基本ノードの構成
- 書誌レコード(
BibliographicResource
)→著者(Agent
)→イベント(生没など) - 書誌レコード→出版イベント(
PublicationEvent
)→出版者、出版地など - 書誌、著者など→記述RDF文書→データセット
- 書誌レコード(
- 語彙と特徴的な記述
- 書誌はDublin Core、Biblioオントロジー、ISBD+英国図書館語彙;著者はさらにBio(経歴)オントロジー、出版イベントはEventオントロジーなど
- 全ての実体が原則として
rdfs:label
によるラベルを持つ - 文書と非文書は明確に区別しているが、典拠はあまり前面に打ち出していない
- 出版、生没など時間/空間概念のあるリソースをイベントとして記述(ただし制作はイベントとして扱われていない)
フランス国立図書館の書誌・典拠グラフ
フランス国立図書館のモデルの特徴
- 基本ノードの構成
- 作品(
Work
)→表現形(Expression
);それぞれから→著者(Person
) - 体現形(
Manifestation
)→作品、表現形 - 統一タイトル(
Concept
)→作品(Work
)、名称典拠(Concept
)→著者(Person
)
- 作品(
- 語彙と特徴的な記述
- Dublin Core、SKOS、RDAからFOAF、Bio、独自のBNFオントロジーまで、多様な語彙の組合せ(BNFのモデル解説参照)
- FRBR/RDAに基づくモデル構造。内容に関するプロパティは作品、形態/出版事項などは体現形、訳者は表現形と分けられている
- 出版者は(意外にも)リテラルのみ
- カタログ(OPAC)と連動するのは体現形と典拠(タイトル、著者)
WorldCatの書誌・典拠グラフ
WorldCatのモデルの特徴
- 基本ノードの構成
- 作品(
CreativeWork
)→書誌(Book
)それぞれから著者(Person
) - 書誌(
Book
)→出版イベント(PublicationEvent
)→出版地(Place
)、出版者(Agent
):ショートカットあり - OPACカタログ(
InformationResource
)←→書誌(Book
)→書籍(ProductModel
)
- 作品(
- 語彙と特徴的な記述
- 全面的にSchema.orgを採用
- 作品(というより表現形)と書誌(書籍)の2段階。作品データは対応書誌データのマージから?
- 作品の
workExample
が書籍/書誌(Book
)だが、一方で書籍のworkExample
が商品としての「本」(ProductModel
)。ISBNは「本」のプロパティで、同じISBNの書籍が複数あることも- ただしSchema.orgでは
isbn
はBook
のプロパティ。またBook
とProductModel
がworkExample
で結ばれるということも本来ない関係
- ただしSchema.orgでは
- 著者情報はVIAFにリンク
- 作品にはWorldCat内典拠ほかLC典拠や書誌から生成したものなど多数の“著者”があり、集約されていない。また作品/著作によっては書籍からWorldCat内典拠を指すこともある
各国図書館のプロパティ比較
- 書誌(体現形)と著者のプロパティ
項目 NDL BNB DNB BNF Worldcat タイトル dct:title dct:title dc:title dct:title scm:name 著者 dct:creator dct:creator dct:creator, bibo:authorList (W)dct:creator scm:creator 訳者 dct:creator dct:contributor dct:contributor, bibo:contributorList (E)marcrel:trl scm:contributor 出版者 dct:publisher blt:publication/ c4dm:agent (dc:publisher) (dct:publisher) scm:publisher 件名 dct:subject dct:subject dct:subject (W)dct:subject scm:about 大きさ等 dct:extent isbd:P1053 isbd:P1053 dct:description scm:numberOfPages ISBN dct:identifier bibo:isbn13 bibo:isbn13 bnf-ont:isbn (P)scm:isbn 著者氏名 foaf:name foaf:name gndo:preferredName ForThePerson foaf:name scm:name 著者生年 rda:date bio:event gndo:dateOfBirth bnf-onto:firstYear scm:birthDate - (W)(E)はWork、Expressionのプロパティ、
scm:
はSchema.org。出版者の()はリテラル値
原則4:さらなるリンク
- 同一組織内での関連情報
- 多くの場合、書誌と典拠、作品と書誌はそれぞれ別のグラフ(ファイル)として返され、“リンク”している
- 件名、分類、地名などの典拠も一般には識別のためのURIだけでなく、“リンク”として詳細情報を提供
- 外部のリンクするデータとのつながり
- 著者からDBpediaへ(DNB、BNF)
- 出版地、生誕地からGeoNamesへ(BNB、DNB)
- 著者あるいは典拠からVIAFへ。VIAFはさらにDBpediaにリンク
- 書誌(体現形)からたとえばRDF Book Mashupへ
VIAFを介したつながり
共有の可能性と課題:プロパティ
- プロパティの違い
- 書誌、典拠の情報項目は目録規則に準じて概ね共通しているが、述語として用いる語彙(プロパティ名)はかなり異なる
- タイトルですら
dcterms:title
、dc:title
、schema:name
の3通り。典拠にはskos:prefLabel
も - 大半はDublin Coreを中心にしているが、図書館以外の領域との共有を考えるとWorldCatのSchema.org採用も一理ある
- プロパティ調整(alignment)
- W3CのSchema Bib Extend Community GroupでSchema.orgの拡張を検討し、定期刊行物記述プロパティも含めて導入
- DCMIではSchema.orgとのスキーマ調整(alignment)を進める動きもあったが、現在あまり進んでいない様子
共有の可能性と課題:モデル
- モデルの違い
- 体現形に相当する実体は全ての図書館のモデルに存在するが、作品、表現形のあり方はさまざま
- 著者、件名などのプロパティが体現形にないなど、異なるモデルでの共有・再利用が難しい
- 著者はすべての図書館で著者実体をモデル化。典拠との関係も食い違いはない
- モデル変換も含めたマッピング
- たとえばSPARQLによるBNF→WorldCatの部分マッピング
CONSTRUCT { #WorldCat Book ?s schema:name ?title ; schema:author ?creator ; schema:publisher [schema:name ?publisher ] . } WHERE { #BNF Manifestation ?s dct:title ?title ; rda:workManifested [dct:creator ?creator ] ; rdaElement:publishersName ?publisher . }
共有の可能性と課題:リンクと同一性
- VIAF経由の同一性リンク
- 著者実体がほぼすべての図書館でVIAFと
owl:sameAs
関係(VIAFはschema:Person
) - 典拠からは
skos:exactMatch
でリンクされているが、この関係は微妙(値域はskos:Concept
)。- 各国図書館からのエイリアスリンク(例えば
http://viaf.org/viaf/sourceID/NDL%7C00444960#skos:Concept
)はPerson
ではなくConcept
に関連付けられるが、調整不足も - VIAF内では、そこから
foaf:focus
でschema:Person
に結び付けられる - Web NDLAは2017年にVIAFへのリンクに
#skos:Concept
を加えて不整合を解消 - さらにVIAFの
schema:Person
からはWeb NDLAのfoaf:Person
(entity名前空間)へのsameAs
が追加されていた
- 各国図書館からのエイリアスリンク(例えば
- 作品レベルでもVIAFとのリンクが一部実現(BNF、DNBなど。NDLも統一タイトルでリンクしているが書誌とつながらない)
- 著者実体がほぼすべての図書館でVIAFと
- 「本」の同一性とISBN
- 体現形レベルでは今のところISBN経由しかつながる手段はなさそうに思われる
- ISBNの記述はそれぞれプロパティが異なり値もリテラルだが、たとえばBNBはISBNを使ってRDF Book Mashupにリンク
- 図書館以外のデータは、直接的にはこのレベルでの連携
- ISBNを手がかりに「作品」について語ることができるよう、ISBN→体現形→表現形/作品の関連整備が望まれる
(参考)英国博物館のCRMグラフ
(参考)英国博物館のCRMモデルについて
- 基本ノードの構成
- 収蔵品(
E22_Man-Made_Object
)→制作(E12_Production
)→ 〃 →作者(E21_Person
) - 収蔵品→購入(
E8_Acquisition
)、現在収蔵地(E53_Place
)など
- 収蔵品(
- 語彙と特徴的な記述
- CIDOC CRMに基づくエアランゲンのオントロジーを中心に、独自のBMオントロジー、SKOS、Biblioオントロジーを併用
- 作者は作品(収蔵品)の直接のプロパティではなく、制作イベントを構成するサブイベントの担い手(
P14_carried_out_by
)として記述される
(参考)公文書館のEADグラフ
(参考)公文書館のEADグラフについて
- 基本ノードの構成
- 資料(
ArchivalResource
)→作者(Agent
) - 資料←→文書庫(
Repository
)←→ウェブページ(FindingAid
) - 資料→制作(
Creation
)→制作時期(Interval
)
- 資料(
- 語彙と特徴など
- RDFグラフは英国アーカイブのメタデータを集めたArchives HubのLD版LOCAH Linked Archives Hubによる
- EADをRDF化したLOCAH RDF Vocabularyのほか、さまざまな語彙の組み合わせ
- 制作はEADの
did/unitdate
に対応してイベントとして扱われている。作者はdid/origination
に対応し、制作イベントとは関連付けられていない
参照先
- 参照したリソース
- Dublin Core Metadata Terms
<http://dublincore.org/documents/dcmi-terms/> - SKOS Simple Knowledge Organization System Reference
<http://www.w3.org/TR/skos-reference/> - The RDA (Resource Description and Access) Vocabularies, open metadata registry
<http://rdvocab.info/> - 国立国会図書館ダブリンコアメタデータ記述(DC-NDL)
<http://www.ndl.go.jp/jp/aboutus/standards/meta.html> - Bibliographic Ontology Specification
<http://bibliontology.com/> - RDA Registry, Joint Steering Committee on Development of RDA (JSC)
<http://www.rdaregistry.info/> - GND Ontology, Deutschen Nationalbibliothek
<http://d-nb.info/standards/elementset/gnd> - British Library Terms RDF schema
<http://www.bl.uk/schemas/bibliographic/blterms> - Semantic Web and data model, Bibliotheque nationale de France
<http://data.bnf.fr/semanticweb-en> - Schema.org
<http://schema.org> - DBpedia
<http://dbpedia.org> - GeoNames
<http://geonames.org> - Virtual International Authority File
<http://viaf.org> - RDF Book Mashup
<http://wifo5-03.informatik.uni-mannheim.de/bizer/bookmashup/> - OCLC WorldCat Linked Data Release ? Significant In Many Ways, by Richard Wallis, 2012-06-21
<http://dataliberate.com/?p=842> - Schema Bib Extend Community Group
<http://www.w3.org/community/schemabibex/> - Schema.org Support for Bibliographic Relationships and Periodicals, by Richard Wallis, Dan Scott, 2014-09-02
<http://blog.schema.org/2014/09/schemaorg-support-for-bibliographic_2.html> - Schema.org Alignment, 2012, DCMI MediaWiki
<http://wiki.dublincore.org/index.php/Schema.org_Alignment> - Erlangen CRM / OWL
<http://erlangen-crm.org/current/> - LOCAH Linked Archives Hub
<http://data.archiveshub.ac.uk/> - LOCAH RDF Vocabulary
<http://data.archiveshub.ac.uk/def/>
- Dublin Core Metadata Terms