書籍の電子化、ScanSnapの設定をどうする ― 2011/07/04 20:39
雑誌の電子化をいったん中断して、書籍の電子化をはじめました。書籍は文字だけで構成されていますからドキュメントスキャナーScanSnap S1500のドライバー設定も一種類で良いのですが、最適な設定がわかりません。試行錯誤で試しています。
ScanSnapのドライバーソフト「ScanSnap Manager」の設定をどうするか? 雑誌「アサヒカメラ」の電子化で様々な工夫をしましたが、文章に特化して改めて最適解を求めたいと思います。ScanSnapは画質がエクセレントからノーマルまで4種類、カラーモードがカラー、グレー、白黒の3種類から選べます。
ScanSnapのドライバーソフト「ScanSnap Manager」の設定をどうするか? 雑誌「アサヒカメラ」の電子化で様々な工夫をしましたが、文章に特化して改めて最適解を求めたいと思います。ScanSnapは画質がエクセレントからノーマルまで4種類、カラーモードがカラー、グレー、白黒の3種類から選べます。
画質はエクセレントを選ぶとカラー/グレーが600dpi白黒1200dpiで一番高精細にスキャンします。高精細な方が美しい、明瞭と望ましいのですが、ファイルサイズが大きくなる、読み込みに時間が掛かるとマイナス面もあります。ファイルサイズは、記憶媒体の単位記憶容量当たりの価格がどんどん下がる現在、余り考慮しなくてもいいのですが、スキャニングの所要時間は上から2番目のスーパーファインと最上級のエクセレントの間には大きな差があります。できればスーパーファインに抑えたいところです。
カラーモードは文章だけの書籍ではカラーを選ぶ人はいないと思いますが、グレーまたは白黒の選択があります。グレーは8ビット256階調で、白黒は1ビット2階調ですから、ファイルサイズには大きな差があります。圧縮が無いとすると8対1の差になります。
画質のエクセレントは白黒の場合1200dpi、スーパーファインの場合600dpiですからファイルサイズが4対1になるはずです。実際のファイルサイズは2対1ですので、縦か横か片側だけ1200dpiでスキャンしているのでしょう。
ScanSnap Managerの読み取りモードタブを開くと右下にオプションボタンがあります。オプションボタンを開いたら次の窓が開きます。グレーや白黒のモードで読むときには重要な設定画面です。
カラーモードは文章だけの書籍ではカラーを選ぶ人はいないと思いますが、グレーまたは白黒の選択があります。グレーは8ビット256階調で、白黒は1ビット2階調ですから、ファイルサイズには大きな差があります。圧縮が無いとすると8対1の差になります。
画質のエクセレントは白黒の場合1200dpi、スーパーファインの場合600dpiですからファイルサイズが4対1になるはずです。実際のファイルサイズは2対1ですので、縦か横か片側だけ1200dpiでスキャンしているのでしょう。
ScanSnap Managerの読み取りモードタブを開くと右下にオプションボタンがあります。オプションボタンを開いたら次の窓が開きます。グレーや白黒のモードで読むときには重要な設定画面です。
一番上の「白黒読み取りの濃度」ですが、カラーモードをグレーに設定するとここは関係しません。白黒モードを選んだときだけ影響します。白か黒か決定するための閾値(しきいち)を決めるバーです。-5から+5まで0をはさんで11段階選べます。
この画面で「文字をくっきりします」のチェックボックスも重要です。このボックスにチェックを入れるとコントラストが高く白黒が明瞭な画面になります。カラーモードがグレーでも白黒でも大きく影響を受けますので慎重に選択します。
文章だけで成り立っている書籍を読むための設定を順列組み合わせで試してみました。その中で一番使えそうな設定が次の5つです。各モードでスキャンしたPDFファイルを拡大しました。文字の違い、特に画数の多い文字の再現性に注目してください。
(1)画質:スーパーファイン、カラーモード:グレー、文字をくっきり:選択。
画数の多い連繋、導入、遺産などの文字も忠実に再現していますが、グレーモードのため文字が黒く締まっていません。
この画面で「文字をくっきりします」のチェックボックスも重要です。このボックスにチェックを入れるとコントラストが高く白黒が明瞭な画面になります。カラーモードがグレーでも白黒でも大きく影響を受けますので慎重に選択します。
文章だけで成り立っている書籍を読むための設定を順列組み合わせで試してみました。その中で一番使えそうな設定が次の5つです。各モードでスキャンしたPDFファイルを拡大しました。文字の違い、特に画数の多い文字の再現性に注目してください。
(1)画質:スーパーファイン、カラーモード:グレー、文字をくっきり:選択。
画数の多い連繋、導入、遺産などの文字も忠実に再現していますが、グレーモードのため文字が黒く締まっていません。
(2)画質:スーパーファイン、カラーモード:白黒、白黒読み取りの濃度:-3、文字をくっきり:選択せず。
(3)画質:スーパーファイン、カラーモード:白黒、白黒読み取りの濃度:0、文字をくっきり:選択。
(4)画質:エクセレント、カラーモード:グレー、文字をくっきり:選択。
(5)画質:エクセレント、カラーモード:白黒、白黒読み取りの濃度:-3、文字をくっきり:選択せず。
スキャニング時間が長く掛かることを除けば(5)が最も細部まで明瞭に再現しており、最良の設定です。
なお、(1)から(5)について、ScanSnapのOCR機能を使って、「検索可能なPDFに変換」処理を実行したところ、すべてのファイルで連繋、導入、遺産を正しく認識していました。人間の眼ではつぶれているように見える文字も正しく認識していますので、画質をスーパーファインにしても大丈夫なようです。ただ、書籍を捨てる前に、書籍の持っている情報をすべて残らず汲み取るためにはエクセレントでスキャニングしたい気持ちも強いです。
最近のコメント