さまざまなタイプの検索と可能性

検索システムのサイクル

クエリ組み立て×対象データという切り口
- 検索指示をユーザが（試行錯誤で）行うのか、エージェントが辿っていくのか
- 対象となるデータは組織化されているか非組織化データか

目的に照らした精度が重要
- 多数の結果セットのうち、どれが目的に近いかを順序付けて知らせる
- PageRankによる順序、適合度順、鮮度順、信頼度ランクなど
ユーザ駆動型の場合
- 求めるものにたどり着くまで、ユーザがさまざまな検索、探索を組み立て、指示する

ゆるやかな対象で関連情報、可能性を探る
- あるジャンルにはどんなリソースが存在するのか
  - 図書館のあるジャンルの棚を一通り眺めてみる
- 漠然とした対象の周辺に、思わぬつながり、収穫を期待している
関連情報を加味して推薦してもらう
- 対象の持つ特徴を分析して類似情報を提示（連想検索など）
- ユーザの類似パターンを調べて「お勧め」を提示する（マッチング）
- 一般的な評判だけではなく、信頼する人（知人）による評価を重視して検索

アンテナ型
- 登録したテーマやキーワードに関して定期的に検索結果をアレンジして報告
- 特定のキーワード（タグ）のブックマークやRSSを通知
ウインドウショッピング型
- 統計的に人気のある、評判になっている「旬な」情報を提示
- 検索キーワード（の集合）の関連性を辿り、テーマを連想式に拡張して面白い情報を発見する
- ウェブログ＋ニュースなど、異なる分野を結びつけて提供
提案求ム型
- データのマイニングにより、未知のパターン、知見を発掘して報告
- グラフの推論により、直接は見えない関連性を発見して報告

どんなデータをどんな切り口で？
- 組織化されたデータを用いた、より的確な検索
- ユーザ情報や関係情報を利用した、よりしっくりくる推薦
- 明示的ではない情報や関連を掘り起こす＝思わぬ発見、楽しくなる検索
検索の入り口と出口を考えよう
- より直感的で親切なクエリ組み立てと検索手続きのサポート
  - たとえば検索語句をダイナミックに提案するCollarity
- 順序つきリストだけではない、目的に合った結果セット表示
  - たとえば結果にキーワードのクラスタをタグクラウド風に加えて示すQuinturaや、結果に信頼度マークを追加するScandoo
- おっと、信頼を忘れずに
  - すべてがブラックボックスの提案は少々気味が悪いかも
  - 経験に照らして適切と思える（≒ユーザの情報を利用した）結果は受け入れやすそうだが
  - どのような評価方法でその提案が出てきたのか、根拠となるデータは確かなのかを確認できる仕組みが必要
本日のお楽しみ！
- 東工大・奥村学氏の「blogWatcher：インターネットから社会の関心、意見を収集・分析する」
- チームラボ・猪子寿之氏のSAGOOL、Labooなどのユニークな検索サービス