RDF関連メモ on Planet masaka : 2021-04
Planet masakaから2021年4月のRDF/セマンティック・ウェブ関連メモを抽出してまとめたものです。
2021-04-28
- Linked Data Signatures Working Group Charter [dratf] w3c.github.io/lds-wg-charter ずっと議論されてきたRDFグラフの正規化と署名の方法を標準化するWG設立案。ちょっと誤解していたけど、個別レコードのRDFというよりデータセットに対する署名ということらしい。cf. lists.w3.org...semantic-web/2021Apr/0059... さらに lists.w3.org...semantic-web/2021Apr/0012...(☞参照) (original post at )
2021-04-27
- SPARQL Blockly langsamu.github.io/sparql-blockly SPARQLクエリをScratchのようなブロック図型組合せで構成できるツール。例えばジャパンサーチのクエリ例「ライセンス区分(商用利用等)別件数」 langsamu.github.io/sparql-blockly/#PREFI... 最初からブロックを動かしてクエリを組み立てるのは難しいかも。右上の?に説明あり twitter.com/_masaka/status/1387040391141... (original post at )
- RDFスキーマの最初の草案から23年になることを受けて@danbriから回想スレッド。源流の1つNFCの図、当初はrdfs:domainと呼んでおらず、役割も値制約や検証であったことなど。勧告になるのは2004年で、domainが複数ある時の扱いなどが固まったのはその前年 twitter.com/danbri/status/13869934374724... (original post at )
- @danbri well, I try to remember the old story that would be related to interpretation of src attribute. btw RDF 1.0 spec doesn't have "outdated" warning (via fixup.js) www.w3.org/TR/rdfa-syntax Do you still think it's relevant to post on ML ? (original post at )
- JSON-LD 1.0 - "superseded" UI on site is overly harsh and pushy lists.w3.org...public-json-ld-wg/2021Apr... W3Cサイトで勧告の旧版を開くとoutdatedだといって過剰な警告が出されるのは酷い措置だと思っていたが、@danbriから、旧版に準拠している利用者が問題ありと感じないようにすべきだと。完全に同意 (original post at )
2021-04-23
- Best Practices? An array of "description" properties to break up long text? lists.w3.org...public-schemaorg/2021Apr/... 長いテキストを配列に分割してよい?→RDFグラフでは順序がないので要注意。逆に元データが配列でもRDFマッピング時は(RDFリストは別にして)連結することも。例えばジャパンサーチdignlの目次 (original post at )
2021-04-22
- Open Research Knowledge Graph www.orkg.org/orkg 研究の貢献(データセット、論文など)を構造化データで記述していろいろな形で視覚表現できるようにするというものらしい。データセット(の比較)はRDFが得られるが、論文や著者は(HTMLテーブルではそれらしいプロパティが使われているが)得られない。SPARQLエンドポイント、ダンプもあるがRDFの対象は同じと思われる。Wikiからたどるのがよさそう gitlab.com/TIBHannover/orkg/orkg-fronten... ML告知 lists.w3.org...semantic-web/2021Apr/0045... (original post at )
- Item Quality Evaluator | Wikidata item-quality-evaluator.toolforge.org アイテムIDのリストに対して、それぞれのORESスコアと平均値を計算してくれる。リストはSPARQLクエリの結果として与えることもできる。ORESはWikimediaプロジェクトに対して機械学習でスコアを算出するAPI。合わせてWikidataアイテムの制約違反チェックをするPythonツールも。cf lists.wikimedia.org/pipermail/wikidata/2... (original post at )
2021-04-20
- Items from the Musée du Louvre added to Cultural Japan ld.cultural.jp/snorql/?query=SELECT+%3Fc... 先日公開されたルーブル美術館DBから日本関連アイテム141件をRDF化し、カルチュラル・ジャパンに追加しました。件数は少ないですが根付、印籠などがなかなか興味深いです。検索アプリでも cultural.jp/search?fc-source=%E3%83%AB%E...(☞参照) (original post at )
2021-04-19
- Yosemite Project Webinar: LinkML – A Linked Open Data Modeling Language yosemiteproject.org/?p=511 先日紹介されていたプロジェクトのZoom会議録画が公開されたと(☞参照) (original post at )
- SPARQL-ML Community Group www.w3.org/community/sparql-ml RDFの知識グラフを利用するために機械学習を用いる方法(自然言語→クエリ自動生成など)を考えようというCG発足。Edgard Marxの提案なのでDBpedia Neural Question Answeringあたりが近い話か (original post at )
2021-04-15
- LinkML - Linked data Modeling Language github.com/linkml/linkml モデルをClass、Slot(プロパティ)、Type(データ型)の組み合わせで、YAMLなどで記述するとJSONスキーマ、JSON-LDコンテクスト、ShExなどを生成するというものらしい。Zoom会議があるというのでdboothが転送していたML lists.w3.org...semantic-web/2021Apr/0031... (original post at )
2021-04-12
- Apache Jena 4.0.0 lists.w3.org...semantic-web/2021Apr/0025... 約7年ぶりのメジャーアップデート。RDF-starの実装、Luceneが8.8.0、IRIの扱いなど。Java11が必要だというので、導入は見送り(☞参照) (original post at )
2021-04-11
- Common Format and MIME Type for Comma-Separated Values (CSV) Files (bis) tools.ietf.org/html/draft-shafranovich-r... CSVのフォーマットとMIME型を定義したRFC 4180が2005年に発行されてから時間が経ち、改訂の提案などもあるので改訂版の検討を始めるというI-D。文字コードのUTF-8化、改行コードの扱いなど (original post at )
- Records in Contexts - Ontology www.ica.org/en/records-in-contexts-ontol... ISAD(G)、ISAAR(CPF)、ISDF、ISDIAHを統合してアーカイブのRDFを記述するというRiC概念モデルに基づくオントロジー。EGAD(Expert Group on Archival Description)による。記述例がGitHubで提供されているが、非常に複雑。フィルムの構造化記述は?というMLから lists.w3.org...public-schemaorg/2021Apr/... Re: structured data for film stocks (original post at )
2021-04-07
- Apache Any23 2.4 Release lists.w3.org...semantic-web/2020Oct/0005... 昨年10月の更新をDLして入れてみたが、IOUtilsのエラーが出てうまく動かず。相変わらず-Xmx6000mがNGで、CLASSPATHも長すぎて下手するとコマンドプロンプトの最長文字制限を超えてしまう(☞参照) (original post at )
- Re: Request for feedback about RDF-star lists.w3.org...semantic-web/2021Mar/0053... RDF-starの仕様で導入する新プロパティなどを既存のrdf:空間に置いてよいか、別名前空間とすべきかという意見募集→danbriから、将来のRDF WGはRDF-starとは異なるアプローチを取る可能性もあるので、別にしておくほうが良いと(☞参照) (original post at )
- Semantic Web and Knowledge Graphs in the Communication of ACM Magazine lists.w3.org...semantic-web/2021Feb/0035... ACMコミュニケーション誌2001年3月号に掲載されている2つの記事の紹介。Pascal Hitzler, A Review of the Semantic Web Field, doi:10.1145/3397512 およびClaudio Gutierrez and Juan F. Sequeda, Knowledge Graphs, doi:10.1145/3418294 全文オンラインで読める (original post at )
- LinkedDataHub 2.0: The New Knowledge Graph Experience atomgraph.com/blog/linkeddatahub-2-the-n... SPARQLエンドポイントのフロントエンドとして、カード型DBぽい出力を簡単に作成できるということらしい。cf. lists.w3.org...public-lod/2021Mar/0025.h... (original post at )
- How are OWL defined datatypes intended to be used? stackoverflow.com/a/66888357/1260887 OWLで新しいデータ型を定義した時「そのデータ型のレキシカル空間は空となり、したがってデータに用いてはならない」ことについての疑問への回答。組込みデータ型の扱いは全て個別に定義され推論エンジンなどに組込まれていること、型構文(レキシカル)制約を意味的に定義するのは悪手であることなど。独自データ型は値域制約には使える。cf lists.w3.org...semantic-web/2021Mar/0069... (original post at )
- Web Data Commons - Schema-org Table Corpus webdatacommons.org/structureddata/schema... WDCのデータから、Schema-orgの43クラスについてインスタンスをホストごとに約420万の表にまとめたと。例えばPersonなら約92万の表に664万行(=人)など。ML lists.w3.org...public-schemaorg/2021Mar/...(☞参照) (original post at )