ちょっとしたメモ

地理コードのURI

OASISから国コード、言語コードを識別するためのPSI = Public Subject Indicator(公開主題指示子)の案が1月6日付で公開されている。PSIはトピックマップ(Topic Maps)で共有可能な主題(トピック)を示すための仕組みだが、識別子としてURIを用いているため、そのままRDFでも利用できる。たとえば言語コードに、一般的なjaというリテラルを用いる代わりに、http://psi.oasis-open.org/iso/639/#jpn と表現しようというわけだ。

OASISの提案する国コードPSIはISO 3166、言語コードPSIはISO 639をベースにしているのだが、よく使われる2文字コードではなく、国の場合は3桁数値コード、言語の場合は3文字コードを採用している。だから、日本国のPSIは http://psi.oasis-open.org/iso/3166/#392、日本語の場合は上記のような具合だ。もっとも、公開されているPSIはまだ提案(proposal)段階で、以前の検討段階では2文字コードも使われていたようではある。意見歓迎とのこと。

ところで、国レベルではなくて都市レベルで地理メタデータを付与したいと考えたときには、グローバルに使える識別子がどうも見あたらない。世界中の地名を網羅したシソーラスといえば Getty Thesaurus of Geographic NamesTGN)が挙げられるが、これは7桁のユニークな数値コードはあるものの、URIが定義されていない。RDFで記述するにはDublin Coreのスキーム修飾要素にTGNがあるが、これは"1001032"などのIDコードよりも、"Tokyo (metropolis)"といった名前を念頭に置いているようで、あまり使いやすくないのだ。

ウェブログサービスで「地域別ディレクトリ」をつくってRSSなどにメタデータを付与しようとか、flickrのタグを使って地図上に写真を表示するmapprなどの例に見られるように、国と緯度経度の中間レベルにあたる地理メタデータのニーズはそれなりに高いはず。この場合、単なる名前ではなく、

<dcterms:coverage rdf:resouce="urn:tgn:1001032" rdfs:label="Tokyo"/>

という具合にグローバルな識別子を使えると、表記の違いによるぶれがなくてありがたいわけだが、残念ながら今のところ都合の良いものは見あたらない。2001年頃のISOの文書で urn:tgn:... という記述を見かけたこともあるんだけどな…