人気ブログランキング | 話題のタグを見る

アナログな洋書を読みたかったので…(OCRソフト人柱の記)

このあいだのドン・ブルースの本もそうですが、ウチにいくつか読んでみたいカートゥーン関係の洋書がありまして、電子辞書とか翻訳ソフトとかも持ってるんですがなかなか単語を打ち込んだり文を打ち込んだりするのがおっくうでした。
翻訳ソフトなんかはwebの文を読むときは結構役に立ったりしてました。知ってそうな単語ばっかりでもつながると解読不能なときなんかは、翻訳ソフトで文ごと訳すと”なるほど”と思うときがあります。それをなんとかアナログでもしたい。でも文を打ち込むのはイヤ。
で、思い立ったのがOCRソフト。macには読んde!!ココがあったので、たいした考えなしに購入してしまいました。

買う前は”読むページをデジカメで撮ったらサクッと認識させて翻訳ソフトに流せば楽勝"とか思ってたんですが、アマ過ぎでした。



デジカメで撮ったページを早速認識させてみたら…
文になってません。ていうか、漢字だらけなんですがorz。 たしか英文を読ませたんだが…。

いろいろやっているとどうも認識率を上げるためにはいろいろ手を加える必要があるみたい。

モノクロにする。
コントラストをあげる
ゆがみを直す。

…この時点でPhotoshop起動。コントラストも"レベル調整"とかでやり始めてしまった。
ゆがみも"自由に変形"とかでカッチリ直したくなる。
あと文字の間隔が大事なようで、1024pixの写真を1600に拡大したら認識率があがった。

また、このソフトはページから文の固まりをまずブロックとしてアタリを付けて、そこから1文ずつ読み取っていくようで、ブロックは自動のほかユーザーが指定することも可能。
ありえないブロックなんかは削除していって、アタリがつかなかったところにブロックを追加修正していく必要がある。あとになってこのブロックの順番も決められる(決める必要がある)ことが判明。レベル調整で暗くなっちゃったところはブロックを細かく分けて認識させてみる。

…等とやっているとだいたい9割がた読めるようになってきた。細かい部分についてこのソフトは認識に自信のない箇所を赤で示してくれるので、どのくらい正しく認識してるかがわかる。変な文字になっているところは文字を結合したり分割したりすることで正確な文字にすることが可能。
テキストウィンドウと画像ウィンドウを同時に表示すると、テキストでカーソルをおいているところが画像のどの部分なのかを見ることができるので、答え合わせも一目瞭然でカンタン。
アナログな洋書を読みたかったので…(OCRソフト人柱の記)_a0015997_128813.jpg

間違っていたら再認識させなくても直接打ち込めば速

いや、最初から直接打ち込んだ方が速くないか?

という疑問とイヤな汗が浮かぶのをとりあえず無視しつつ、答え合わせが終わったところでようやっと翻訳ソフトへコピペ。
ということで、なんとか当初の希望を果たせたんですが…はたして直接文を入力するのとどっちが効率的かは微妙かなぁ。自分としては画像修正自体は苦痛ではないんですが、それでもページ数が多いとさすがに大変だなぁ。ただ文章を楽しむ点でいえば、最後にひととおり訳す感じなのでテンポは悪くないかもです。全く使えないワケではないですが、チクチク作業が必要なので素人におすすめはしません…。


ということで、ドン・ブルース本のA NEW WAVE と Composing MESSIAH のところ約3ページほどを読んでみました。
知らない単語じゃないのに繋がるとわからない文は多くて、
I know the sensual glide of the lead releasing the feelings of the heart.
って文で "lead"が鉛筆の芯のことだとわかったときは膝ポンポン打ちたくなりました。

まだ先は長いですね…。
by yoshihide-ohkubo | 2005-06-11 23:46 | カートゥーン


<< ニムの秘密にまとめ記事が! Alias SketchBoo... >>