メトロポリタン美術館RDF:ジャパンサーチモデル版Metropolitan Museum RDF in Japan Search Model
メトロポリタン美術館オープンアクセスCSVのデータから、日本関連のレコードを選んでジャパンサーチ(JPS)利活用スキーマによるRDFを生成しました。できる限りJPS正規化辞書を基本に作者を正規化し、統合クエリも可能にしています。
This is an RDFization of The Metropolitan Museum of Art Open Access CSV Japan related records with Japan Search (JPS) data model. Most artists names are normalized based on JPS agent dictionary, making federated query possible.
メトロポリタン美術館RDFはCulture Japanに統合しました。以下はその前身となったRDFモデルの説明です。また上記フォームのクエリはCulture JapanのSPARQLエンドポイントに送られます。
Metropolitan Museum RDF has been integrated into Culture Japan. The followings are the explanation of the model which was a starting point of Cultural Japan.
マッピングについてAbout this mapping
2019年4月8日付のCSVから、Culture欄が"Japan(ese)"であるもの、およびArtist Display Bioに"Japan"を含むもの23,282件を抽出し、RDF化したものです。CSVには44のフィールドがありますが、そこから下の表に示すフィールドを選んでRDFに変換しました。
23,282 records are extracted from CSV (as of 2019-04-08), whose Culture field is "Japan(ese)" or Artist Display Bio field contains "Japan". Some of 44 fields in CSV are mapped to RDF, as shown in the following table.
- レコードの型(クラス)は、基本的にはClassificationに基づき、JPSクラス(必要に応じてサブクラス追加)にマッピングする別表を用意して付与しました。この値が得られない場合に一部Object Nameを利用しました。
- メトロポリタン美術館の分類は(日本関連に出現するもので)200近くありましたが、細かな分類はまとめて41のクラスとしました。そのうち、JPSのクラスでは範囲が広すぎてサブクラスとして定義したものは、印籠、根付、宝石など21あります。
- Artist Display Nameの英文名のうち、1280をJPS正規化名にマッピングしました。これにより、作者名を持つレコード7875件の93%が(少なくとも一人は)正規化されています。
- 縦線(
|
)で区切られている値は、前処理で分割してプロパティを反復しました。Titleフィールドの場合は、最初のもののみrdfs:label
としました。 - Is Public DomainフィールドがTrueであるものについて、アクセス情報の
schema:license
にCC0のURIを設定しました。- JPS利活用スキーマでの
schema:license
は、画像などのデジタルオブジェクトに付与するものです。しかしここでは、RDF記述に含めているサムネイルだけでなく他の高解像度画像にも適用できる権利情報として、JPS利活用スキーマ検討の最終段階まで候補になっていた「提供オブジェクト一括のライセンス」を、アクセス情報に記述しています。
- JPS利活用スキーマでの
- 画像URIはCSVに含まれないので、別途APIを用いて取得しました。ソースデータ情報(
jps:sourceInfo/jps:sourceData
)はこのAPIで得られるJSONにリンクしています。
- Record type (class) is assigned using Classification to JSP class mapping table. If Classification is not available, Object Name field was used.
- Although neary 200 classifications found in Japan related items, this dataset uses 41 classes by merging some detailed classifications. 21 classes are newly defined as subclasses of existing JPS classes.
- Among English names in Artist Display Name, 1280 are mapped to JPS dictionary. This contributed to normalize 93% of records with Artist names.
- Values delimited by vertical bar (
|
) are divided into multiple tokens by pre-processor. The first token of Title field value is mapped tordfs:label
. - If Is Public Domain is true,
schema:license
with CC0 URI is added to access information node. - Image URIs are obtained via API, since they are not included in CSV. Source data information (
jps:sourceInfo/jps:sourceData
) links to JSON from this API.
CSVフィールド field label | マッピングmapping 1 | マッピングmapping 2 | データ例data sample |
---|---|---|---|
Object Number | jps:accessInfo/jps:contentId | - | JP595 |
Is Public Domain | jps:accessInfo/schema:license | - | True (→CC0 URI) |
Object ID | id (subject uri) | schema:description | 37046 |
Department | schema:description | - | Asian Art |
Object Name | schema:description | (rdfs:label, if no Title) | |
Title | schema:name | rdfs:label | 六十余州名所図会 播磨 舞子の浜|Harima, Maiko no Hama |
Culture | schema:description | - | Japan |
Period | jps:temporal/jps:era | schema:description | Edo period (1615–1868) |
Portfolio | schema:description | - | - |
Artist Role | jps:agential/jps:relationType | - | Artist |
Artist Prefix | jps:agential/schema:description | - | Designed by |
Artist Display Name | schema:creator | jps:agential(/schema:description) | Utagawa Hiroshige |
Artist Suffix | jps:agential/schema:description | - | - |
Object Date | schema:temporal | jps:temporal(/schema:description) | 1853–56 |
Medium | schema:description | - | Polychrome woodblock print; ink and color on paper |
Dimensions | schema:description | - | Oban tate-e 14 x 9 7/16 in. (35.6 x 24 cm) |
Credit Line | schema:description | - | Purchase, Joseph Pulitzer Bequest, 1918 |
City | schema:description | - | - |
Country | schema:description | - | - |
Region | schema:description | - | - |
Classification | rdf:type | schema:description | Prints |
Rights and Reproduction | jps:accessInfo/jps:contentRights | - | - |
Link Resource | jps:sourceInfo/schema:url | - | http://www.metmuseum.org/art/collection/search/37046 |
Metadata Date | jps:sourceInfo/schema:dateModified | - | 4/8/2019 8:00:03 AM |
Tags | schema:about | - | Landscapes|Trees |
データ例の列で示した値は、http://purl.org/net/ld/jpsearch/https://ld.cultural.jp/data/metmuseum-37046のようにマッピングされます。
Data shown in data sample column is mapped as http://purl.org/net/ld/jpsearch/https://ld.cultural.jp/data/metmuseum-37046.
なお、展覧会展示リストはCSVからではなく、美術館サイトの過去の展覧会情報を元に生成しました。
Recent exhibition item list is gerenated from past exhibition pages, not from CSV.