W3CのRDF Validatorによる多国語の図形描画が、ようやくうまく行くようになった模様。Olivier Thereauxのメールによれば、We have managed to make the graphing tool use a font covering a very hight number of scripts.
ということで、実際、要素内容だけでなく要素型名に日本語を用いたRDFもうまく図形表示できている。2年以上かかってしまったわけだが、これでまともにValidatorが使えるようになった。
依然として、パースと検証はできるものの描画エラーになるケースもある。いくつかチェックしていて、リテラルに二重引用符("
)が含まれるとうまく行かないことが判明した。
- マッチする二重引用符の中身はグラフには描画されない
- マッチしない二重引用符があると描画エラーになる
- 二重引用符内に記号(
:./#?
など)があると描画エラーになる
挙動から推測すると、Graphviz用のdotファイル生成時に引用符のエスケープをきちんとしていないために、引用符内のテキストをdotのラベルと解釈してしまい、ラベルとして不正な場合にエラーを起こしているような感じだ。画像サイズが非常に大きくなるデータもやはり描画不能だが、小さなRDFなのにエラーになるときは、リテラルノードを確認してみるといいかもしれない。
それでも、小さな問題は残っているとはいえ、RDF Validatorで日本語を含むグラフ描画ができるようになったことは喜ばしい。
関連メモ:
- RDF/XML視覚化ツール改善、あるいはGraphvizとUTF-8 (2006-11-07)
- RDF Validatorの日本語処理 (2004-10-08)