Goodpic.com
2003年08月12日

Link分析で内容の近いブログ検索 Technorati サービスとアルゴリズム

Technorati http://www.technorati.com/

weblogのURLを入力すると、Link Cosmos = そのweblogにリンクしている他のweblogの一覧と、リンクのあるURLをリストアップする。自分のweblogがどのようなところから参照されているかがよくわかります。
Spiderロボットでweblogを検索し、記事内に含まれるリンクの関連性を分析。自分のblogを更新する際にTechnoratiにPINGすると、Index検索でよりよい結果が得られるようです。MovableTypeユーザーは”WEBLOGの設定”の更新時に通知するURLに以下を加えるだけです。
Ping URL http://rpc.technorati.com/rpc/ping
PublishされたHTMLの他にRSS Feedも解析するそうですが、無くてもよいとのこと。
一日に一回、DBの情報をアップデート。

詳しい説明がTechnolatiを運営しているDavid Sifryのブログに書かれています。TOP100等のランキングを作成する際のアルゴリズムについても記述があります。
http://www.sifry.com/alerts/archives/000306.html
http://www.sifry.com/alerts/archives/000228.html#000228
http://www.sifry.com/alerts/

Technoratiに戻るとサービスとしては

- Breaking News 
weblog上で最近、議論されているニュース(ソースは4000サイト)のランキングと、引用しているweblogのリスト(COSMOS)を分かりやすく表示。ニュースソースとweblogを関連付けて表示するので、Daypopより情報量が豊富

- Hot Link
ソースをニュースだけに限らず、更新されたWEBサイトやweblogなど幅広く、15分毎に更新。日本のblogも結構リストに出てきています

- Current Events in the blogosphere 
有名なBlog(150000のblog)の内容のランキングを30分毎に更新

- Find out who's linking to you
BlogのURLを入力して”Get Link Cosmos”することで、リンクしているBlogを検索

現在、開発中のサービス

- Top 100 Interesting Recent Blogs


- Top 100 Interesting Newcomers


- Watch List
Watch Listに登録したブログのLINK COSMOSやGoogle Rankingを毎日通知してくれる。E-mail(年間5ドル)とRSS Feed(年間10ドル)を選ぶ有料サービス

いかにして情報の鮮度と重要さをレーティングするかを色々と試行錯誤中のようで、かつその過程がオープンに公開されているので面白いです。
詳しい説明はこのページでも


■ 同様のサービス
BlogMatcher http://www.blogmatcher.com/シンプルに自分のブログで引用しているリンク先を、同じく引用しているweblogを検索してくれる。それほど色々な試みがされているわけでは無いですが、ディープリンクはより重要、Topページへのリンクは重要度を下げる、などの説明は参考になる。登録フォームから、調べたいweblogのURLを入力して、情報を更新できるのは便利。詳しい説明はこちら

Posted by jkanekomt at 2003年08月12日 23:31 | trackBack



Comments
Post a comment









Remember personal info?







関連記事