Tuesday, November 29, 2011

非破壊で本を自炊する


Googleが世界中の主な図書館の蔵書をスキャンして無料で提供していることは、以前にもブログで取り上げた。
また、グーテンベルクプロジェクトはもっとも歴史のある(1971年創始)電子書籍図書館として有名である。
いずれも著作権の切れた書籍をスキャンしてコンピュータに取り込み、希望者に無料で提供するものである。
膨大な図書を破壊しないで(図書館の蔵書だから)どのようにコンピュータに取り込んでいるのか、不思議だったが、その謎がとけた。
Googleは毎時数千頁を全自動で読み込む特別なスキャナーを開発して使用している。 その技術を全自動ではなく、人手を介して一般化したスキャナーも商品化されているようだ。
私が自炊で奮闘した経過は何度かこのブログで報告しているので、如何に労働集約的な作業であるかは、お分かりいただけていると思う。
既に、全部の蔵書は破壊して(切り離して)スキャンの後、すべて廃棄した。
中には大型図版本で、廃棄するには惜しい本もあったが、残していては作業が徹底しないので、涙を飲んで捨てた。
このビデオを見て欲しい、本を1ページずつめくって写真にとってからコンピュータに取り込む方式だ。 時間はとてつもなく掛かりそうだが、非破壊で自炊が可能であるところがみそ。ちょっと私には忍耐できそうにない。
もう少し自動化したのがこのビデオ。1ページづつめくるのは人手だが、効率はよさそう。でもやはり人力が大変そう。
1時間に2000頁取り込むことが出来ると言っている。
Googleはこの方式でページめくりをエアーを使って自動化しており1時間に数千枚の効率だと報告されている。
究極の自動スキャンは東京大学が開発中の、動画で頁をぱらぱらとめくる様子をビデオにとり、後からコンピュータによるデジタル処理をかけて、内容を再構築する方法。イメージはこんな感じ
その他にも、全自動による本のスキャン機器はまだまだ、開発されている。
興味のある方はこちらからどうぞ。
スキャナーを本当に効率良く、コストを下られれば、既存の紙の本を電子書籍化することは本格的に普及するだろう。そんな時代がもう目の前に来ている。

日本では出版社、書籍取次会社、書店などと著作権者たちの、抵抗勢力が強くて、デジタル書籍へのスピード感がない。
アマゾンが水面下で、日本の各出版社との交渉を本格的に開始しているらしい、そのうち、日本語の電子書籍がアマゾンから一斉に発売されるのだろう。



No comments: