--- layout: old_post title: fooo.name更新 - バグ潰しとtako3.com互換API permalink: /tatsuya/show/401-fooo-name-tako3-com-api ---
fooo.name 幾つかバグ潰しと、API更新 しました。
主な変更点はtako3.com互換APIの追加です。詳細な情報はこちらをどうぞご確認ください。
次はGreasemonkeyスクリプトでAPIの実験みたいなのをやろうかな。あと、今後のTODOをまとめ
TODO:
・同一アカウント&別人問題の対応
さすがに今のままだと、誤情報が混じってくるのである程度フィルタリングを設けたい。
A) 人と人の繋がりで判断。複数サービスで "tkmr" が同じ "hoge" さんをフレンドにしていれば、その複数サービスの "tkmr" は同一人物とみなす(一致率がある閾値を超えたら)
B) 各ページの特徴語をベイズフィルタに掛ける。自分だったら "tkmr", "ruby", "rails" なんかの頻出語、URL、フレンドのアカウント名等を複数ページで調べる。少なくともこれで海外サービス等の別人はフィルタリング(グルーピング)できるかも。(たとえば "tkmr" の場合は http://www.myspace.com/tkmr )
あとベイズフィルタで閾値を設ければ、死にアカのフィルタもできるかも。作ったけど全く更新していないページ等はマッチしないので。というかB方式はA方式を内包するのか。
・フィルタリング選択
用途によって求められる精度も違うと思う。ゆるい用途ならフィルタも要らないし、ある程度ならベイズフィルタ、さらに信頼できる情報が必要なら「同一セッションで複数サービスの認証を通った証明」フィルタ、とか選択可能にしたい。http://fooo.name/accounts/tkmr?filter=high みたいな
・繋がり情報の収集
サイトのURLパターンはあるので、各ページにある "フレンドへのリンク" のURLをXPath等で設定可能にすれば収集できるかも。
twitter繋がり = //a[@rel="contact"]
みたいな。で http://twitter.com/[name] にマッチすればフレンドのアカウント名も取れるし。人と人の繋がりがHTMLでも提供されてれば汎用的に行けるかな。
・URLの登録拒否サポート(ブロックリスト)
今は細々とやってるので良いかなと思うけど、今後を考えると「私のURLを登録しないで!」というサポートフォームみたいなのは付けた方が良いかな。ブロックリストみたいな。
でもどうやって本人を確認するか、認証APIがある & OpenIDなら認証を通ればOKとできるが。。