--- layout: old_post title: 自動ソーシャルブックマークサービスPathtraqは第二のGoogleになるか? permalink: /tatsuya/show/366-pathtraq-google ---
サイボウズラボからリリースされたPathtraqに興味津々です。
ざっくり言うと「アクセス解析&共有サービス」または「自動ソーシャルブックマークサービス」で、ユーザ(参加者)がFireFoxかIEの拡張をインストールして、日々アクセスしたWebサイトの履歴をPathtraqが保存・解析するサービス。
実際リリースの数日前に「ページ滞在時間に応じてdel.icio.usに自動postするGreasemonkeyスクリプト」なんて同じ方向性のアイデアが(別の場所から)生まれて来てる通り、これは出てくるべくして出てきたサービスな気がする。何故か「ついに来たか」と感じた。「気になったページをブックマーク」なんてかったるいこと言わずに、もう全部ページブックマークしようぜと。これは何処かGoogle的発想を感じる。フィルタリング/ランク付け/クラスタリングなんてことは後でじっくりやろう、まず膨大なデータを集めるのが先だと。実際リリース発表でもYahoo(del.icio.us/はてなブックマーク)に対する Google(Pathtraq)を意識した発言がされている(http://www.computerworld.jp/news/sw/74309.html)
さあ、ここで課題になるのが、膨大で玉石混合なデータからどうやって優れたページを探し出すのか。Google出現前は決定的なアルゴリズムが無くて、仕方が無くYahooが手動でページを登録していた。手動フィルタリング/手動ランク付け/手動クラスタリングだ。Webサイト開設者も手動でYahooへ登録申請をやってたし、検索利用者もまぁ不満は無かったと思う。「自動検索はゴミやスパムサイトだらけだし、Yahooで良いか」みたいな。
でもGoogle出現後は違う、インデックス登録はGoogleBotが自動でします、ゴミ(スパム)サイト除去やランク付けはPageRankで自動にやりますと。Googleの登場でもう悩みはほぼ解決、どんなマニアックなページでも、適切なランク付けをしてGoogleが見せてくれる、もうこれでお宝サイトを探すためにリンク集を延々見て回る必要も無い!必要なのは検索だ、検索!検索!と皆が興味あるキーワードを検索しまくること数年・・・、ついに「もう検索したいキーワード思いつかない」ってことに気づいて、「そもそも検索すべきキーワードが判らない」場合や「今盛り上がってるページが知りたい」場合に検索だけじゃあイマイチだと気づいて、ソーシャル・ブックマークサービスが生まれた。
Google検索は便利だけど、未知の領域へ足を踏み込むときには、そもそもキーワードが判らない。「ハッテン場」ていうキーワードを知らないと「男 場所 出会い」なんて連想する言葉で回りくどく検索するしかなくて、結局普通の出会いサイトばっかり出てくる、みたいな。これはソーシャルブックマークで完全に解決したとは言えないけど、ソーシャルブックマークならタグによるゆるい分類とユーザ同士の「お気に入り/購読」で情報のクラスタリングができるし、ブックマーク時間で「今盛り上がってるページ」も判る。Googleとは別のメリットがあるので皆に受け入れられた。とここまでが自分の認識だけど、どうかな、大きく間違ってはいないと思う。。
さあ、それじゃあソーシャルブックマークのGoogleと期待されるPathtraqのアルゴリズム PageRank はどうなのかと言うと、これは2.0的解決で「皆で考えていこう」という結論なんだと感じた。現にリリース直後のトップページには、この定番ランキングが表示されていて、「1位 mixi、2位 Yahoo!JAPAN、3位 Twitter、livedoor Reader、Google、、」と有名サイトそのままなリストが提示されている悲しい状況だった(今は改善されてる)眺めても知ってるサイトばかりだ、、みたいな。
これは当然でアクセス数でソートすればこういう結果が出る。さらに言えば皆もう知っている情報には興味なくて、なにより本当はみんなのおもしろいものはおもしろくないんだ。万人受けする作品は退屈になりがち、「マンガ」でGoogle検索して出て来た結果の上位100位くらいは知ってる作品ばかりだし、おそらく上位1000位くらいまでには退屈な作品しか並ばない、もうこれはオリコンにランキングされる曲にはクソみたいな曲しか無いのと同じで、宿命なんだ。たぶん。
でもこれはPathtraq(サイボウズラボ)が駄目なわけじゃなくて、そもそもデータの加工はPathtraqの仕事じゃないと切り分けたんだと思う。ブログでも明言されてる通りこれは「APIを公開すること前提」のサービスなんだ。データの収集/管理/配布はPathtraqの仕事だ、だからFireFoxの拡張とIEの拡張作成なんて面倒な仕事をやった、集まったデータをどう加工するかはマッシュアップサイトの腕の見せ所だと。この判断は凄く正しいと思う。
例えばTwitterを正規のページだけ見てても面白さが判らないのと同じだ、IMに登録して、APIを利用した無数のマッシュアップサイトを眺めて、メンテナンス中に出る猫のかわいい画像で心あたためないとTwitterの面白さは判らない、もっと言えば自分でTwitterのAPIからデータを取って来て加工して遊ばないと、本当に理解することはできないんだと思う。
id:dankogaiが「"らき☆すた" は、話にならない部分を、読者や視聴者が補ってはじめて楽しめる話なのだ」(ニコニコ動画で見る二次創作こそが面白い)と言ってるけど、要は「同人誌は書いてる人が一番楽しい」ってことと同じじゃないだろうか?膨大なアクセス履歴(アニメ)のデータベースがあって、それをどう加工するのかはマッシュアップサイト(二次創作者)の腕の見せ所だ、PageRankみたいな優れたアイデアはそう生まれないし、何より一つのアルゴリズムで統一するより、複数の視点/切り口/アルゴリズムでデータを切り出した方が面白い。というか皆で次のPageRankを見つけることを楽しむサービスなんじゃないだろうか?
まだAPIが公開されてないのは残念だけど、ここは良く練ってから出してほしい。公開後のAPI変更は難しいし、なによりAPIにもセンスが問われる。二次創作しやすい作品ってのを意識して「涼宮ハルヒの憂鬱」や「らき☆すた」が作られてるように、マッシュアップし易いかどうか?という点も大きくPathtraqの成功に関わってくると思う。のんびり期待してます。
さぁ、、最近忙しくて久々のブログなので、まだまだ書きたい事はあるけど、今日はひとまず寝よう。