--- layout: old_post title: 画像検索サービスEvernote permalink: /tatsuya/show/415-evernote ---

ベータ中のOCRサービスEvernote ↓

Evernoteで自分の脳を拡張する(プライベートベータご招待)

のベータサービスアカウントが届いたので試してみた。サインアップページから本登録

Evernote Invitation-only Beta - Firefox (Build 0000000000)

CAPTCHAがある。。。

さっそく試してみよう、Evernoteのスキャン力とCAPTCHA、どっちが上か?

Evernote

一文字目 "b" は認識

Evernote

二文字 "b8" は無理。。:(

もう少し弱いCAPTCHAなら解けるかも、ってところか。色々試してみたけど、なかなか性能良い印象。

あとメールに写真を添付して投稿もできる。日本語は未対応ぽい。

ここから登録して、二週間待ちくらいでアカウント届いた。

 

で、関係ないけど最近読んだ本の話を少し


"しあわせの理由 (ハヤカワ文庫SF)" (グレッグ イーガン)

「しあわせの理由」はグレッグイーガンの短編集で、中身も面白かったけど文末の解説が面白かった。

 円周率というものを完全に記述するのに無限のメモリーが絶対必要かというとそんなことはない。「無限のメモリーさえあれば、無限に計算を続けられる円周率計算 のプログラム」は実は有限のメモリーに収められるからだ。「つまりこのプログラムで 計算した数」と定義することで、本来無限のメモリーの必要な情報を、有限の情報のみ で完全に記述できてしまう。

・・・・・・・

 ついでにもっと妙なことを考えてみよう、0から9までの数字とAからZまでの英大文字、それにスペースや記号であわせて四十文字ぐらいあれば英語の文章が作れる。 この文字に二桁の背番号を振る。0は「00」、9は「09」でAは「10」、スペースは 「36」という具合だ。円周率は数字がバラバラに並んでいて無限に続くのだから、その中には何兆桁目かもれないが、どこかに

「0200010009010136201022182010351436233436322912」
と続いている部分が必ずあるはずだ。この数字列を上の背番号表で解読すると
20010911 KAMIKAZE NY WTC
となる。すごいでしょ。この調子でいけば、いままでの人類の過去から未来までの悠久の歴史すべてを円周率の中に読み取ることができるだろう。たかだか有限のノストラダムスの詩文の中から無理してこじつけるより、はるかに確実な無限の大予言・それが有限のプログラムから生み出される。

(坂村 健)

と、そこから「円周率に意味を見いだすのは、見ている自分自身」という話から、イーガンの作品解説に繋がっていく(確かに順列都市なんてこの話そのもの)で、これはこれで面白かった。でも、その後に偶然読んだこれ ↓


"伝奇集 (岩波文庫)" (J.L. ボルヘス)

の中の「バベルの図書館」この解説はネットに山ほど転がっていると思うので、乱暴に要約すると「無限の広さを持ち無限の本数の蔵書がある図書館」の話で、その中でも全く同じテーマが語られていて

ある天才的な司書が図書館の基本的な法則を発見した。この思想家のいうには、いかに多種多様であっても、全ての本は行間、ピリオド、コンマ、アルファベットの二十五字という、おなじ要素からなっていた。また彼は、全ての旅行者が確認するに至ったある事実を指摘した。

広大な図書館に、同じ本は二冊ない。彼はこの反論の余地のない前提から、図書館は全体的なもので、その書棚は二十数個の記号のあらゆる可能な組み合わせを、換言すれば、あらゆる言語で表現可能なもののいっさいをふくんでいると推論した。

思い返せば、昔読んだ「砂の本」も全く同じテーマだったのに、当時は気付かなかった。無限に続く本や図書館(や数字)があるとして、その中には人類の、過去全ての歴史だけでなく未来の出来事も全て書いてあるのか・・・「3/15 ブログでボルヘスについて書く」という文章も確実に書いてある!

 

で、その無限の知識を持つ「砂の本」でも「バベルの図書館」でも、結局人間は何もできずに翻弄されるだけってのが面白いな。「砂の本」も「バベルの図書館」にも索引(インデックス)が無くて、結局人間が扱えるものじゃなかった。

逆に言うともし「砂の本」に索引が付いてたり、「バベルの図書館」に全てを理解した司書(文中では「書物の人」と表現されている)がいれば、無限の知識を人間が利用することができる。「書物の人」は文中では

他のすべての本の鍵であり完全な要約である一冊の本が存在し、ある司書がそれを読みとおし、神に似た存在となった。

と表現されている。無限の情報を持つ「バベルの図書館」よりも、その要約である一冊の本の方に価値がある。

 

これ、Web上に無限に近い情報があっても Google が持つ索引(インデックス)を使って要約を提供してくれないと、上手く活用することができない。ってのに通じるし、AutoPagerizeやLDRizeが広まったことでメタデータの重要性が高まってきているのにも通じると感じた。無限のデータもメタデータがあって初めて価値がでる。

無理矢理話を最初のEvernoteに戻すと、、Evernoteの技術は面白いし凄い。ただ個人が持ってる少量のデータなんて大したことないんだから、Web全体の画像を対象にしてメタデータを付けてくれたら面白いな。

これ、半年後になってみたら、EvernoteがGoogleに買収されててGoogle Image searchとして実現されてたりして。