雑誌の電子化で数々の難題が発生 その32011/07/01 00:22

  雑誌「アサヒカメラ」電子化での難題の数々。 その3は裏面が透けて見えることです。

 これもアフリカ大陸でのヌーの大移動を扱った写真ですが、裏面の広告が透けて見えます。裏面の文字も読めそうです。しわも強く出ています。
裏の絵が透けて、しわも強調されたスキャン結果

平面スキャナーでスキャンするとき、黒い紙を裏に重ねて透過反射でスキャン時の裏面が透けて取り込まれる現象を防止しています。ドキュメントスキャナーではA3スキャン用のケースを利用して中に黒い紙を重ねる手が使えそうですが試していません。
平面スキャナーで処理、裏画面の透けが消えた
 裏面のカメラ広告が見えなくなりました。同時にしわも消えました。手間は大幅に増えますがしかたがありません。

雑誌の電子化で数々の難題が発生 その22011/06/30 23:58

 雑誌「アサヒカメラ」電子化での難題の数々。 その2はドキュメントスキャナーの誤作動です。
 ごくまれにですが、一部の暗い写真では、更に暗く処理してしまいます。元の写真がまったく判別できないほどひどい例もあります。この黒い画面に白い点点が見えますが、これが何かわかりますか?実はヌーの大群が草原を移動している場面です。
暗いスキャン結果

ドキュメントスキャナーで再スキャンしても同じ結果になります。暗い写真ページに対しては相性がよくないようです。平面スキャナーで読み込み画像処理してAdobe AcrobatでPDF化したら元の写真ページが再現できました。
平面スキャナーで読み込み処理

発生頻度は高くはありませんが許容できない例です。
(Adobe Acrobatで見開き表示したディスプレー画面をプリントスクリーンでコピーしています。)

雑誌の電子化では数々の難題が発生2011/06/30 22:28

 必死の取り組みで雑誌「アサヒカメラ」の電子化はほぼ終えようとしています。
しかし、雑誌の電子化は大変な労力がかかるなあとつくづく感じています。

 ここまでアサヒカメラの電子化(PDF化)を達成できたのは、ドキュメントスキャナー「ScanSnap S1500」の功績が一番大きいのは間違いありません。平面スキャナーに比べ処理速度で100倍以上の能力を発揮してくれました。これなくしては不可能でした。S1500以外のドキュメントスキャナーについては何の知識もないのでコメントできませんが、ドキュメントスキャナーなしで書籍の電子化は不可能です。

 雑誌「アサヒカメラ」電子化での難題の数々。 その1は強いしわの発生です。

 今回、処理した80年代、90年代のアサヒカメラは、各ページを束ねて雑誌にまとめるために接着剤+紐綴じのような処理がされているのです。製本について知識がないので紐綴じという表現は間違っているかもわかりませんが、雑誌を切断するとそのように見えるのです。
 雑誌はグラビア印刷されているアート紙?、モノクロの巻末広告が並ぶ上質紙?、印刷もカラーやモノクロオフセット印刷と品質の劣る凸版印刷などが混ざっていて、髪質と印刷方法が同じ一定枚数のページが単位になって綴じられています。その束を集めて接着剤で固めて一冊の雑誌に仕上げているように見えました。
 この紐綴じ部分が経年変化の紙の伸び縮みに対応できず、各ページにしわを発生させる原因になっているように思います。写真が命のカメラ雑誌で、このしわがすごく醜い電子化結果につながってしまいます。
しわが強く出たドキュメントスキャナー処理

これでは写真として鑑賞できる許容限界を超えています。アイロンでしわ取りをやってみました。見た目にはほとんどしわが取れますが、ドキュメントスキャナーで再度スキャンしてみた結果は減りましたがまだ残っています。
アイロンでしわ取り後、再スキャン結果

平面スキャナーでスキャンしてPhotoShopで処理しました。スキャン時には圧を加えて平面化するようにしています。ほとんど、しわが取れました。ここまで手間を加えると膨大な時間を使うことになります。
しわが消えた平面スキャナー処理結果

結局、自分にとって重要な写真で、しかもしわの発生がひどいものだけはアイロンでしわを伸ばし、平面スキャナーで処理。余り重要ではないがしわがひどいものはアイロンでのしわ伸ばしだけを実施しました。
(上の写真はすべてPDFファイルをAdobe Acrobatの見開き表示モードで見た状態です。ディスプレーは1792ドット×1344ドットとかなり高精細なものを使っていますので雑誌の見開き表示で細かい文字がそのまま読めます。PDF化した雑誌を見開き状態で読むには最低このくらいの画素数のディスプレーが必要です。)

雑誌の電子化(PDF化)に四苦八苦、七転八倒2011/05/30 23:12

 3月始めにドキュメントスキャナーS1500を購入、更に大型裁断機も購入して準備は整えたが、どうしたらいいのか見当が付かない状態だった。マニュアルや参考書を読んでもよくわからない。最初から完璧によろうと構えすぎたようだ。

 やりながら、失敗を重ね、ベストなやり方を見い出していくしかないとやっと分かってきた。多分、人様のやり方を読んだり調べてもあまり役に立たないと思う。条件や目的が人それぞれだからだ。書籍の電子化に当たって、全てが完璧な結果が得られない場合、何を優先して何をあきらめるかは個人の判断だからだ。

 ベストな結果を求めれば時間と手間が掛かる。それでも妥協せず時間と手間を書籍電子化に投入するのか、不十分な不満足な結果でも短時間に手間をできるだけ省いて数をこなすのか、判断の分かれ目だ。

 最初に取り組み始めた電子化の対象書籍が、カメラ雑誌「アサヒカメラ」である。一番難しいものから始めたなあ、といま、思っている。
 活字だけが並ぶ一般書籍と異なり、雑誌は、写真と文章が並存しており、両方を最適な状態に電子化するのは難しい。
 ここで私の判断は写真を優先して忠実に取り込むこと。写真は多階調(モノクロは8bit、カラーは24bit)、一方、文章は白か黒かの1bitである。1冊平均350ページの「アサヒカメラ」の全ページを多階調でスキャニングしている。

 写真優先で取り込んでいるのだが、カメラ雑誌は電子化に当たって難問が多い。
見開きページが多いのだ。左右のページを使って一枚の写真を掲載している。背表紙を裁断機で落とすとき、大目に切り落とすと、PDFリーダーの見開きモードで見たとしても左右がつながらなくなってしまう。
カメラ雑誌は見開きページが多い

 更に、綴じ込み写真が挟まれている号もある。綴じ込み写真は付録ではなく、正規の本文として扱われていてページ番号が割り当てられている。これも別途、平面スキャナーで取り込んで処理しないとページ数が合わなくなる。
 このアンセル・アダムスの大きな写真は片面を4回に分けて平面スキャナーで取り込み、画像処理ソフト(Photoshop)で一枚に合成した。裏表で8回のスキャニングが必要で画像処理時間も含めて長時間の作業になる。
雑誌の綴じ込み写真
 雑誌の綴じ方が紐綴じと接着剤を併用していて、紐の部分が長年の圧力で紙に圧を加えていて多数のしわをつくっている。このしわがスキャナーで過剰に強調されて取り込まれ大変醜い結果になる。このしわを取り除くためスチームアイロンを使って伸ばそうと努力したが、軽減はできるが完璧にはとれない。ページ数が多いので膨大な時間が掛かる。

 3月始めにドキュメントスキャナー大型裁断機を購入したが、以前から持っていた平面スキャナーディスクカッターも必要な場面がある。ディスクカッターは回転刃スライド方式のCarl DC-200という安価な機種を持っているが、慣れると0.1mm単位の精密な裁断ができる。大型裁断機で切った後、不必要な部分の修正切りに使っている。平面スキャナーはepsonのGT-X700を使っている。

 他にも山のようにトラブルや問題が襲い掛かってくる。雑誌の電子化は並大抵な作業ではないことだけは分かってきた。

書籍の電子化(PDF化)は実践の中からノウハウを掴むしかない2011/05/30 22:37

 3月始めにドキュメントスキャナーScanSnap S1500を購入、更に改良型大型裁断機も購入して準備は整えたが、どうしたらいいのか見当が付かない状況が長く続いた。マニュアルや参考書を読んでもよくわからない。最初から完璧によろうと構えすぎたようだ。

 やりながら、失敗を重ね、ベストなやり方を見い出していくしかないとやっと分かってきた。多分、人様のやり方を読んだり調べてもあまり役に立たないと思う。条件や目的が人それぞれだからだ。書籍の電子化に当たって、すべてがベストな結果を得られない場合、何を優先して何をあきらめるかは個人の価値判断だからだ。

 ベストな結果を求めれば時間と手間が掛かる。それでも妥協せず時間と手間を書籍電子化に投入するのか、不十分な不満足な結果でも短時間に手間をできるだけ省いて数をこなすのか、判断の分かれ目だ。

 最初に取り組み始めた電子化の対象書籍が、カメラ雑誌「アサヒカメラ」である。一番難しいものから始めたなあ、といま、思っている。活字だけが並ぶ一般書籍と異なり、雑誌は、写真と文章が並存しており、両方をベストに電子化するのは難しい。ここで私の判断は写真を優先して忠実に取り込むこと。写真は多階調(モノクロは8bit、カラーは24bit)、一方、文章は白か黒かの1bitである。1冊平均350ページの「アサヒカメラ」の全ページを多階調でスキャニングしている。

原発は津波にも安全です-文部科学省の副読本2011/04/15 23:03

asahi.comによると文部科学省経済産業省資源エネルギー庁と組んで発行していた副読本に「原発について「大きな地震や津波にも耐えられるよう設計」と記されており」(中略)「副読本は小学校向けが「わくわく原子力ランド」、中学校向けが「チャレンジ! 原子力ワールド」という名称で、全国の小中学校に配布されている。」

 公教育の場に、一方的で根拠のない原発賛美の安全物語を持ち込んでいた文部科学省、文科省に原発推進本を売り込んだ経済産業省外局の資源エネルギー庁には深刻な反省が求められます。
 原発事故対応をめぐってテレビ最多登場の原子力安全・保安院資源エネルギー庁と同じ経済産業省の外局。

1983年発行のOh!PASOPIA創刊号2011/02/18 01:23

1983年秋発売。東芝のPASOPIAに特化したパソコン誌「Oh!PASOPIA」創刊号です。広告や記事に「時代の空気」が漂ってきます。ああ、懐かしい・・・なあ。
Oh!PASOPIA創刊号表紙

 裏表紙はPASOPIA16の広告。先行するNECのPC-9801に対抗する機種だったとように思います。
Oh!PASOPIA創刊号裏表紙

 Oh!PASOPIA創刊号の目次。当時のパソコン誌が何を話題にしていたかよくわかります。
Oh!PASOPIA創刊号目次

 見開きでPASOPIA7の内部解剖図を掲載しています。左上の写真はCPUがSHARP製Z80Aであることを示しています。左下の写真にはPROMが6つ搭載されていたことを示しています。PROMにはBIOSとBASICプログラムが焼き込まれていたのですね。
Oh!PASOPIA創刊号、内部解剖頭