ちょっとしたメモ

メタデータ、アクセシビリティ、そして検索

石川准先生からのご招待で、静岡県立大学でセマンティック・ウェブについてのお話をさせていただきました。草薙駅から大学まで上り坂を歩いていくと汗ばむほどで、途中の道には梅の花が一杯に開いていました。

セマンティック・ウェブそのものの技術的な話や応用例に加え、アクセシビリティの関連性について考えてみるというのが、今回の課題。RDFでは純粋にメタデータを記述して、プレゼンテーションは利用者側アプリケーションで自在にできるというのはアクセシビリティの基本には違いないが、何かもう少し突っ込んだ連携というものがありそうな気がする。

今日の話では、画像の構成部分を説明するメタデータを、マウス操作を前提にスタイルシートで表現するケース音声読み上げを念頭に置いたスタイルシートで示すケースを紹介してみた(実際に使った例はリンク先とは別のもの)。視覚的な情報の一部を座標というメタデータで表すことで、理解を補助する材料にならないかという試みだ。まだまだ不十分とはいえ、この方向の可能性はもっと探ってみたいところ。

あとで石川先生と雑談しながら伺ったところでは、アクセシビリティの観点でセマンティック・ウェブにまず期待するのは、やはり検索の精度ではないかということだった。A.A.O.セミナーの基調講演を見ても、必要な情報にたどり着くまでの困難が大きな問題になっているわけだから、的確な検索が実現すればメリットは大きいに違いない。

自己紹介(FOAF)とか、イベントカレンダー(RDFical)といった、形のはっきりした情報は、現在のRDF/XMLのアプローチでも十分に機能しそうなことは見当がつく。しかし一般的なウェブ文書について、目覚ましい検索精度が得られるようなメタデータを確実に付与していくというのは、簡単なことではない。GRDDLのような形でXHTML文書からメタデータを抽出する方法が検討されているとはいえ、それにしたって文書作者が自分で適切なマーク付けで付加情報を示すことが前提だ。バーナーズ=リーにインタビューした時は、彼は文書作成ツールの役割が重要であると言っていた。それは確かにそうなんだが、ツールがどんな形でメタデータを付加してくれるのかというと、まだ具体的なビジョンは見えてこない。

もうひとつの可能性としては、第三者によるメタデータ付加サービスのようなものがあるかもしれない。たとえば宮川達彦さんがbulkfeedsで試みているsimilarity searchは、10万単位のRSSフィードからtf/idfによってそれぞれのキーワードを拾ってくるわけだが、こういう仕組みを通じてなら、作者の負担もないし、ある程度客観的な基準によるメタデータを加えることができそうだ。複数のサービスが抽出メタデータの適切性を競うという展開もあり得るかな(こうなると、ProofとかTrustといった階層が必要になってくる)。

検索エンジンの力が認識されたことで、SEOなんていう考え方が出てきて、タイトルや見出しがようやく重視され始めたことを考えれば、「セマンティック・ウェブ検索サービス」の普及によってみんなが積極的にメタデータを提供するようになるだろうという見方もできる。まぁしかし、これは鶏と卵というより、キラー・サービスが出てこないと物事は動かないという証左とも言えるので、やはり定型的な情報のデータベースとか、第三者メタデータといった形で、使える検索/フィルタリングサービスが登場してくることが重要なんだろう。

関連メモ: