2008年07月29日

Webページの内容を分析して順位付ける検索エンジン「Cuil」が登場


突然のように、1200億のWebページを既にインデックス化した検索エンジン「Cuil」(クールと読む)が登場しました。しかも、検索結果の内容表示順位は、これまでの検索エンジンに見られる人気度(関連リンク、ランキングなど)によるのではなく、各Webページの内容分析による("content-based relevance methods")との事。詳しくはここを参照。





実際にここから検索してみました。





「Madonna」(歌手のマドンナを想定して)をキーワードとして、「Cuil」で検索してみた結果がここ





同じ「Madonna」を、Googleで検索した結果はここ





見た目の検索結果の表示の仕方は、明らかに異なります。しかし、検索結果の比較となるとどちらが良いとも言えないのが正直な所。選んだキーワードが単純すぎるのか・・・・

他の歌手の名前で検索した時に、Googleで検索すると、同じ様なレコード販売サイトなどが多く出てくるのに対して、「Cuil」で検索するとそれらが目立たなくなったように見えるケースがありました。
指定キーワードに対するWebページをカテゴリー分類した上で、カテゴリー毎にランキングをして表示するのであれば、特定カテゴリーのWebページが目立つ事も無くなるように感じました。

検索を試みている人のカテゴリーを徐々に知識として蓄積して、それにあったカテゴリーの情報を他のカテゴリーより増やしていくという学習効果が発揮される(制御できる)ようになると、「セマンティック」Webの方向に進む第一歩になるのではないでしょうか。
この事は、表示を「全般」と「カテゴリー別」にタブで分けている事(他の検索エンジンでも関連用語検索できるようにしている)で、暗示しているのかもしれません。


そうだとすると、「個人毎の検索時の履歴情報などを蓄積しない」と宣言してしまうのは、今後適切であるかどうかには疑問が残ります。蓄積の仕方(例えば、ネットワークの特定企業ではなく、個人毎のローカル環境に残す)で対応して行く必要があるのではないかと思います。


尚、未だ品質上は課題があるようです。サーバーダウン(?)をしたようですし、タブの情報にアクセスすると「結果 0」のメッセージが出たりしました(が、他の時は正常に表示)。


posted by 鎌倉太郎 at 01:23| ☁| Comment(0) | TrackBack(0) | 日記 | 更新情報をチェックする
この記事へのコメント
コメントを書く
コチラをクリックしてください

この記事へのトラックバック