music & knowledge sharing
検索システムのサイクル
- ユーザの問いかけとシステムの答え
- 問答のサイクルによりユーザの知識状態が変化していく。

- 知りたいことを何らかの問い合せ手順で表現
- 何らかの形のデータを検索
- 結果セットを何らかの方法で提供
- 結果表現を受けて知識の状態が変化する
- 必要に応じ次の検索
検索サイクル各ステップのさまざま
- 誰が問い合せを組み立てる?
- クエリの方法や検索式は誰が考えて指示するのか
- ユーザが検索式を組み立てる、エージェントが推論しながら進める
- 検索の入り口をどう設計するか
- フリーキーワードによる検索、項目を指定した検索
- ツリーや表からの選択、Ajaxやグラフィカルツールによるサポート
- どんなデータを対象にする?
- データベースのように構造化されたデータ
- (X)HTMLのような半構造化データ
- 構造のないテキストデータ
- さがし物は何ですか?
- 問い合せの目的がはっきりしているか、あいまいか
- 探すものによって、結果セットの表現には異なる方法が求められる
検索の形式的なタイプ:誰がどんなデータを扱うのか
- クエリ組み立て×対象データという切り口
- 検索指示をユーザが(試行錯誤で)行うのか、エージェントが辿っていくのか
- 対象となるデータは組織化されているか非組織化データか

目的によるタイプ(1):求めるものがはっきりしている検索
- 目的に照らした精度が重要
- 多数の結果セットのうち、どれが目的に近いかを順序付けて知らせる
- PageRankによる順序、適合度順、鮮度順、信頼度ランクなど
- ユーザ駆動型の場合
- 求めるものにたどり着くまで、ユーザがさまざまな検索、探索を組み立て、指示する

エージェント駆動型で目的のものを探索
- セマンティック・ウェブ風「お使い型」検索
- 推論しながら探索し、探索結果を元にさらに探索
- 理由とともに結果を提示

目的によるタイプ(2):漠然とした検索
- ゆるやかな対象で関連情報、可能性を探る
- あるジャンルにはどんなリソースが存在するのか
- 漠然とした対象の周辺に、思わぬつながり、収穫を期待している
- 関連情報を加味して推薦してもらう
- 対象の持つ特徴を分析して類似情報を提示(連想検索など)
- ユーザの類似パターンを調べて「お勧め」を提示する(マッチング)
- 一般的な評判だけではなく、信頼する人(知人)による評価を重視して検索

目的によるタイプ(3):何かいいネタはないか
- アンテナ型
- 登録したテーマやキーワードに関して定期的に検索結果をアレンジして報告
- 特定のキーワード(タグ)のブックマークやRSSを通知
- ウインドウショッピング型
- 統計的に人気のある、評判になっている「旬な」情報を提示
- 検索キーワード(の集合)の関連性を辿り、テーマを連想式に拡張して面白い情報を発見する
- ウェブログ+ニュースなど、異なる分野を結びつけて提供
- 提案求ム型
- データのマイニングにより、未知のパターン、知見を発掘して報告
- グラフの推論により、直接は見えない関連性を発見して報告
検索次世代の“可能性の中心”は…
- どんなデータをどんな切り口で?
- 組織化されたデータを用いた、より的確な検索
- ユーザ情報や関係情報を利用した、よりしっくりくる推薦
- 明示的ではない情報や関連を掘り起こす=思わぬ発見、楽しくなる検索
- 検索の入り口と出口を考えよう
- より直感的で親切なクエリ組み立てと検索手続きのサポート
- 順序つきリストだけではない、目的に合った結果セット表示
- おっと、信頼を忘れずに
- すべてがブラックボックスの提案は少々気味が悪いかも
- 経験に照らして適切と思える(≒ユーザの情報を利用した)結果は受け入れやすそうだが
- どのような評価方法でその提案が出てきたのか、根拠となるデータは確かなのかを確認できる仕組みが必要
- 本日のお楽しみ!