書籍の電子化、ScanSnapの設定をどうする2011/07/04 20:39

 雑誌の電子化をいったん中断して、書籍の電子化をはじめました。書籍は文字だけで構成されていますからドキュメントスキャナーScanSnap S1500のドライバー設定も一種類で良いのですが、最適な設定がわかりません。試行錯誤で試しています。
 ScanSnapのドライバーソフト「ScanSnap Manager」の設定をどうするか? 雑誌「アサヒカメラ」の電子化で様々な工夫をしましたが、文章に特化して改めて最適解を求めたいと思います。ScanSnapは画質エクセレントからノーマルまで4種類カラーモードカラー、グレー、白黒の3種類から選べます。
ScanSnap Manager
 画質はエクセレントを選ぶとカラー/グレーが600dpi白黒1200dpiで一番高精細にスキャンします。高精細な方が美しい、明瞭と望ましいのですが、ファイルサイズが大きくなる、読み込みに時間が掛かるとマイナス面もあります。ファイルサイズは、記憶媒体の単位記憶容量当たりの価格がどんどん下がる現在、余り考慮しなくてもいいのですが、スキャニングの所要時間は上から2番目のスーパーファインと最上級のエクセレントの間には大きな差があります。できればスーパーファインに抑えたいところです。
 カラーモードは文章だけの書籍ではカラーを選ぶ人はいないと思いますが、グレーまたは白黒の選択があります。グレーは8ビット256階調で、白黒は1ビット2階調ですから、ファイルサイズには大きな差があります。圧縮が無いとすると8対1の差になります。
 画質エクセレントは白黒の場合1200dpi、スーパーファインの場合600dpiですからファイルサイズが4対1になるはずです。実際のファイルサイズは2対1ですので、縦か横か片側だけ1200dpiでスキャンしているのでしょう。
 ScanSnap Managerの読み取りモードタブを開くと右下にオプションボタンがあります。オプションボタンを開いたら次の窓が開きます。グレーや白黒のモードで読むときには重要な設定画面です。
読み取りモードオプション
 一番上の「白黒読み取りの濃度」ですが、カラーモードグレーに設定するとここは関係しません。白黒モードを選んだときだけ影響します。白か黒か決定するための閾値(しきいち)を決めるバーです。-5から+5まで0をはさんで11段階選べます。
 この画面で「文字をくっきりします」のチェックボックスも重要です。このボックスにチェックを入れるとコントラストが高く白黒が明瞭な画面になります。カラーモードグレーでも白黒でも大きく影響を受けますので慎重に選択します。

 文章だけで成り立っている書籍を読むための設定を順列組み合わせで試してみました。その中で一番使えそうな設定が次の5つです。各モードでスキャンしたPDFファイルを拡大しました。文字の違い、特に画数の多い文字の再現性に注目してください。

(1)画質:スーパーファイン、カラーモード:グレー、文字をくっきり:選択。
画数の多い連繋、導入、遺産などの文字も忠実に再現していますが、グレーモードのため文字が黒く締まっていません。
スーパーファイン グレー チェックを入れる

(2)画質:スーパーファイン、カラーモード:白黒、白黒読み取りの濃度:-3、文字をくっきり:選択せず。
スーパーファイン 白黒 -3 チェック外す
 (3)画質:スーパーファイン、カラーモード:白黒、白黒読み取りの濃度:0、文字をくっきり:選択。
スーパーファイン 白黒 0 チェックを入れる

(4)画質:エクセレント、カラーモード:グレー、文字をくっきり:選択。
エクセレント グレー チェックを入れる


(5)画質:エクセレント、カラーモード:白黒、白黒読み取りの濃度:-3、文字をくっきり:選択せず。
 スキャニング時間が長く掛かることを除けば(5)が最も細部まで明瞭に再現しており、最良の設定です。
エクセレント 白黒 -3 チェックを外す

なお、(1)から(5)について、ScanSnapのOCR機能を使って、「検索可能なPDFに変換」処理を実行したところ、すべてのファイルで連繋、導入、遺産を正しく認識していました。人間の眼ではつぶれているように見える文字も正しく認識していますので、画質をスーパーファインにしても大丈夫なようです。ただ、書籍を捨てる前に、書籍の持っている情報をすべて残らず汲み取るためにはエクセレントでスキャニングしたい気持ちも強いです。

コメント

_ alex ― 2011/08/14 05:21

はじめまして
僕は書籍(積読本)の電子書籍化をしたくて色々調べている中で、こちらのブログにたどり着いた者です。
電子書籍化の記事を全て読ませていただきました。

裁断機とスキャナですごく迷っていたのですが
裁断機は同じ物を注文しようと思いました。
ただ、実家暮らしで、書籍が増えた重みで下の階の建てつけが悪くなり、親がブチ切れているので電子化をしようとしているので、24kgもある裁断機が届いたらそれはそれで更に切れさせそうで怖いですが。。

スキャナは最近canonから発売された物とs1500で非常に迷っていますが、s1500を購入した際にはまた参考にさせていただきたく思います。

ブログに感動しましたのでコメントしてしまいました。
長々と失礼いたしましたm(_ _)m

_ photo ― 2011/10/05 23:31

alexさん、コメントとお寄せいただきありがとうございます。
電子書籍化の記事を全部読んでいただいたとのこと、お役に立てればうれしい限りです。
できるだけ丁寧に正確にお読みくださる方にお伝えしたいと努力したつもりですが、書ききれない「コツ」のようなものが必要だと思います。これは試行錯誤しながら自分なりのやり方を会得していくしかないと思います。
alexさんの積読本がきれいに処理されて部屋がすっきりすると良いですね。
実は、まさかと思う本にホッチキスが使われていて裁断機が刃こぼれしました。
刃こぼれ箇所を避けて小さな文庫本を処理しています。油断大敵です。

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

※投稿には管理者が設定した質問に答える必要があります。

名前:
メールアドレス:
URL:
次の質問に答えてください:
今年は西暦○○○○年ですか? 全角数字4桁で答えてください。

コメント:

トラックバック

このエントリのトラックバックURL: http://phototech.asablo.jp/blog/2011/07/04/5944045/tb

※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。