RDF関連メモ on Planet masaka : 2019-06
Planet masakaから2019年6月のRDF/セマンティック・ウェブ関連メモを抽出してまとめたものです。
2019-06-30
- Virtuoso Memory Analysis based on INI Entries docs.google.com/spreadsheets/d/1-stlTC_W... DBpedia、UniProtなど大規模RDFストアのVirtuosoの環境、ハードウェア、メモリなどを設定ファイル他からまとめた一覧表。WikidataをVirtuosoにロードしたらという流れから lists.wikimedia.org/pipermail/wikidata/2...(☞参照) (original post at )
2019-06-25
- Proposal for representing Aggregate Statistical Data lists.w3.org...public-schemaorg/2019Jun/... 統計の個々の値ではなく"△が□で男性"のような制約条件組合せ=StatisticalPopulationで値の集合体を表現する提案がGuhaから。その各年などの個別測値がObservation。Data Cubeの1つの軸分を表すというか。意見求むと (original post at )
2019-06-24
- 件の論文DBpedia FlexiFusion Best of Wikipedia > Wikidata > Your Data:PreFusionとして複数章(言語)DBpediaからsameAsクラスターにGlobal IDを付与=normalize、同じS-P対を持つ文をグループ化して(object, provenance)リスト→不要な値をreduce、矛盾する値をresolve(関数プロパティなど利用)=aggregate。これらを6言語群に適用して個別より精度が向上すること、カタラン語版にそれを当てはめることでリッチ化できることを検証。Global ID global.dbpedia.org(☞参照) (original post at )
2019-06-23
- Create RDF dump of structured data on Commons phabricator.wikimedia.org/T221917 コモンズの構造化データRDFを定期的にダンプとして生成するということで検討中。前回のRDFフォーマット提案と関係あるのかどうかよくわからないが(☞参照) (original post at )
- Structured Data - qualifiers for depicts support.. lists.wikimedia.org/pipermail/wikidata/2... ウィキメディア・コモンズ構造化データの描画内容(Wikidata P180)に、その色、数量などの修飾子を追加可能に。例 commons.wikimedia.org/wiki/File:Bendovo_... P180による描画内容記述はすでに50万を超えたと commons.wikimedia.org/wiki/Commons_talk:...(☞参照) (original post at )
- Linked Data Shapes, Forms and Footprints www.w3.org/DesignIssues/Footprints.html ShExなどのシェイプでデータ構造と項目(API)を、“フォーム”で編集UIを、フットプリントで保存情報を定義し、柔軟な非集中型LDアプリケーション構築を(TimBL御大の草案)。@RubenVerborghが詳しい記事 ruben.verborgh.org/blog/2019/06/17/shapi...(☞参照) (original post at )
- Re: Scaling Wikidata Query Service lists.wikimedia.org/pipermail/wikidata/2... Thad Guidryから、ソートが極めて重い操作であること、スケールの問題は究極的にI/Oに帰着、GoogleやIBMは資源をふんだんに使ってデータやインデックスの複製をメモリ上に置くことで高速化を実現している、など(☞参照) (original post at )
2019-06-22
- DDI XKOS released for public use lists.w3.org...semantic-web/2019Jun/0130... 2年前に公開レビューされていたSKOSの統計分類用拡張語彙が、いきなりv1.2として公開。分類法の対象領域はcovers、分類記号(概念)の階層にgeneralizes/specializes、実体→分類記号はclassifiedUnderなど。仕様 www.ddialliance.org/Specification/XKOS/1...(☞参照) (original post at )
- Overload of query-wikidata-org lists.wikimedia.org/pipermail/wikidata/2... WikidataのSPARQLエンドポイントが、悪質ボット対策にUser-Agentヘッダ確認を強化ということで、単発アクセスでも厳密にチェックされる模様。プログラミング言語が自動付与するUAヘッダは不許可だそうなので、ツール作者は要注意 (original post at )
2019-06-20
- @TJ_paki ありがとうございます。編集者様に評価していただけるのはとても嬉しいです。巻末にしっかりした参考文献リストがあったので、ジャパンサーチのSPARQLという仕組みの応用に使えるかもと試してみました。まだ半分少ししか読めていないのですが、とても楽しく味わっております :) (original post at )
2019-06-19
- 『まいボコ』明治娯楽物語コレクション www.kanzaki.com/works/2016/pub/image-ann... 参考文献リストの書名をジャパンサーチSPARQLで一括検索(完全一致で打率6割)、残りを手動検索して生成。同書の引用元をIIIFビューアで閲覧できます。マニフェストがないもの(約3割)もrelatedからメタデータにリンク twitter.com/magazine_k/status/1140779384... (original post at )
2019-06-17
- おお、SPARQLエンドポイントも。 sparql.dl.itc.u-tokyo.ac.jp たとえば"制作国: フランス"である資料は sparql.dl.itc.u-tokyo.ac.jp/?query=PREFI...(☞参照) (original post at )
- 東京大学学術資産等アーカイブズポータルの各アイテム詳細表示でJSONを選択すると、JSON-LDによるRDFメタデータが。Dublin Coreを中心にした記述で、DCに対応がない細かな項目名は導入句付きdct:descriptionにマッピングされています www.kanzaki.com/works/2014/pub/ld-browse... twitter.com/UTokyo_GenLib/status/1140504... (original post at )
2019-06-16
- Re: What is a Knowledge Graph? lists.w3.org...semantic-web/2019Jun/0052... 知識の組合せは難しい(標準がない)のに、知識グラフはスケールするのか?→そもそも知識グラフとは→PatHayes参戦:知識のダイアグラム表現はパースの存在グラフからあるが「知識グラフ」は基本的に文の集合。俄然面白いスレッドに (original post at )
2019-06-15
- Treasured Manuscript collection gets the Wikidata Treatment blog.library.wales/?p=20597 ウェールズ国立図書館のペニアース写本メタデータをWDに投入、他のデータとのリンクも利用し単一機関を超えた分析や視覚化が可能になったと。さらにテキスト記述からキーワード抽出→目録にない情報追加も試行 twitter.com/WIKI_NLW/status/113846933838... (original post at )
2019-06-13
- RFC 8610: Concise Data Definition Language (CDDL): A Notational Convention to Express Concise Binary Object Representation (CBOR) and JSON Data Structures tools.ietf.org/html/rfc8610 CBORのデータ構造を記述するANBF的な記法。CBORモデルのサブセットであるJSONのデータ構造定義も可能(☞参照) (original post at )
2019-06-11
- Re: DBpedia download vs DBPedia SPARQL data sourceforge.net/p/dbpedia/mailman/messag... どうやらDBpediaは今後databusを用いて更新していくらしい。URIもWikipedia型から変更するという話もあるようだが、いまひとつはっきりしない。ISWC論文が示されているので、読んでみてからまた考える(☞参照) (original post at )
2019-06-10
- CIDOC CRM Issue 361: Recording an E41 in RDF www.cidoc-crm.org/node/5718 RDFモデルでほとんどすべての値をクラスにしており、文字列値をどう記述するかが未だに不明確という、昨年1月の問題提起は結局放置されたまま。RDFでなにか記述しようとしたら、これがクリアされないことには何もできないのに (original post at )
- 英政府サイトのStep by stepのページ(さまざまな手続きを段階を踏んで説明)に、schema:HowToタイプを使ったJSON-LDを埋め込み。検索結果のリッチスニペットに手順が示されると(環境や言語設定による?)。リストはschema:positonで順序を示すことで、厄介なrdf:Listを回避している twitter.com/samdub/status/11369992454399... (original post at )
2019-06-08
- Scaling Wikidata Query Service lists.wikimedia.org/pipermail/wikidata/2... 急成長するWikidataのサービスがそれに応じスケールするための課題・現在の対応についてのスレッド。先月のAre we ready for our futureも一つのきっかけ lists.wikimedia.org/pipermail/wikidata/2... 関連talkではRDF/SPARQL vs グラフDBの議論も(☞参照) (original post at )
2019-06-06
- Archives and their collections - Issue #1758 github.com/schemaorg/schemaorg/issues/1758 2017年にArchitypes CGからの提案 www.w3.org/community/architypes/wiki/Alt... が出て、2つのクラス追加を求めた課題。しばらくそのままになっていたのが今年(2019)3月にdanbriからArchiveComponentはIntangibleではなくCreativeWorkの下に位置づける修正案が示され、それによってv3.5でPending変更が告知されてclose。その先は?(☞参照) (original post at )
- Companies House – Linked Data Service business.data.gov.uk/companies 英国の登録法人データをURIから取得したりSPARQLで検索したりできる。登録法人語彙とその拡張かな。2016年から提供されている模様。相変わらずURIがリンクになってない某法人インフォよりかなり(ry(☞参照) (original post at )
2019-06-04
- Deep Fakes, Phishing & Epistemological War - how we can help combat these lists.w3.org...semantic-web/2019Jun/0004... hstoryから、あたかも本人が話しているかのような動画まで偽造できてしまう時代に、フェイクやフィッシングを防ぐ技術としてSWを用いるべし、W3Cが先頭に立って、と (original post at )
- minimal hardware requirements for loading wikidata dump in Blazegraph lists.wikimedia.org/pipermail/wikidata/2... Wikidataのサーバー規模が示されていて興味深い。16コア、128GBメモリ、1.5Tディスク(SSD)、データベース(jnlファイル)670Gと (original post at )
- The Power and Pitfalls of Inferencing medium.com/swlh/a07d06ef54e7 データソースが多様化するとOWLなどの組み込み推論が使いにくくなり、SPARQLクエリがそれに代わる役割を担うというのは分かる。しかしクエリ結果(のCONSTRUCT)をINSERTして使うって、ごく小規模で静的なストアじゃないと現実的とは思えないんだが (original post at )
2019-06-01
- @mlpoulter well, that sounds like (all UK citizens in Wikidata) JOIN (all works createdby someone in Japan Search) ;-) (original post at )