RDF関連メモ on Planet masaka : 2019-12
Planet masakaから2019年12月のRDF/セマンティック・ウェブ関連メモを抽出してまとめたものです。
2019-12-28
- 二十一代集を電書リーダーで読む www.kanzaki.com/works/ld/jpsearch/waka-r... #ジャパンサーチ のSPARQLエンドポイントから歌集、歌人単位でメタデータを取得し、動的に電書を生成します。年末年始に勅撰歌人の和歌をじっくり読めるよう作ってみました。絵入源氏リーダーの姉妹版(☞参照) (original post at )
- 二十一代集電書リーダーをぼちぼち改良。概ね良いのではないか。しかしWikidata登録の画像で勘違いっぽいのがあるのは頭痛い (original post at )
2019-12-24
- BMはSPARQLが壊れているが、検索結果ページが分かりやすい規則でできているので力尽くで変換した (original post at )
2019-12-23
- WikidataにMoMA IDが収録されているので、これはありがたいと利用してみたら、どうも機械的にWikipediaとマッチングさせているようで、誤同定が多数。やはりWikiものは用心せよということか (original post at )
2019-12-16
- 東京大学学術資産等アーカイブズポータルのデータ143,868件、約450万トリプルのRDFを #ジャパンサーチ に追加しました。資料と各コレクションの関係および文書館の資料階層をisPartOfで表現しています。例えばコレクション別一覧 jpsearch.go.jp/rdf/sparql/easy/?query=SE... twitter.com/jpsearch_go/status/119887450...(☞参照) (original post at )
2019-12-11
- IIIFの型やサムネイルなどいろいろやり直して改良。さらにハーバード美術館もAPIがあったことを思い出し、とりあえず最小限の変換。それでも蓄積のおかげでけっこうまともなものができた感じ (original post at )
2019-12-08
- IIIFマニフェストからのメタデータ変換は、出所ごとの違いに手こずったが、ほぼうまく行った。続いてシカゴ。チープなデータしかないと思いきや、パラメータによって詳しい情報が得られると判明。これはなかなか手応えがありそう (original post at )
2019-12-06
- 人間文化研究機構の二十一代集データベース34346件、約100万トリプルのRDFを #ジャパンサーチ に追加しました。歌人3291人を辞書登録して正規化、うち38%をWikidataにリンク。さらに三十六歌仙などの情報も加えています。例えば女房三十六歌仙の勅撰歌 jpsearch.go.jp/rdf/sparql/easy/?query=SE...(☞参照) (original post at )
2019-12-04
- やっと正規化が完了。一息入れてから、このあと辞書をRDF化するためにいくつか作業 (original post at )
- 辞書を用いての全件変換、勅撰集に関する追加情報RDFと進めて、細部では手間取ったものの、ほぼ期待通りの成果が出た。明日は新規辞書の情報を反映したRDF生成 (original post at )