iPadで軽快に読める自炊PDFを作る

最近は電子媒体の出版が増えてきていいかんじだが、もっと増えて欲しい今日この頃。

自炊に関するメモをずっと前に書きっぱなしだったのを発見したので、せっかくなのでここに残しておく。
AmazonでぽちったScanSnapと裁断機が届いた当初に書いたもの。

Acrobatのバージョンが新しいWindows版の方を買ったので、スキャンはWindows機でやっている。
とはいえどうしてもというもの以外、紙の本は買わないようにしているので、自炊する機会もほぼなくなってしまったけれど。
ちなみにマンガとか小説に関しては紙派。

画質と容量の妥協点を探して

富豪なスキャン

自炊PDFは紙をスキャンしたものなので、最初からPDFで作られた文書よりもどうしても汚いかんじになる。

解像度高ければきれいになるだろうと1200dpiでスキャンすると確かにきれいではあるのだが・・・

スキャンに時間がかかる。これはまだ一度きりなので許容範囲としても、読むときのロードにも時間がかかる。
動きがもっさりして、気持ちよくスイスイページをめくっていけない。
ファイルサイズも大きくなり、転送やらなにやらの取り扱いもおっくうである。

世の技術はまだこのような富豪なやり方を許してはくれないようだ。

いろいろな読み取り方を試す

結論から言うと600dpiで読み取ってそのまま圧縮とかしないというのがベストだった。
さらに白黒にすることで要領節約。

400dpi以下にするとさすがに汚い。
読み取り設定で圧縮5とかにするとゴミが入る。

こう書くとあっさりだが割といろいろと試した末の結論。

OCRの謎

OCRしたらファイルサイズが減った。
でもiPad上では重くなった。

AcrobatでOCRした時
  • A. 読み取る => ファイルサイズを小さく => 検索できるようにする なぜかここで容量が減る
  • B. 読み取る => 検索できるようにする => ファイルサイズを小さく なぜかもっと容量が小さく

PDF謎だらけ。

Aの時はiPad上ではちょっと重い。

でもiPadに持って行くと英単語が検索できず。
たぶんGoodReaderの問題

(現在の最新バージョンのGoodReaderでは問題ないので修正済みの模様)

ScanSnapの付属ソフトでOCRしたとき

ScanSnapの付属ソフトでOCRすると多少は検索できる英単語が増える。
しかしAcrobatのOCRでやった時と五十歩百歩みたいな感じ。

  • C. 読み取って検索もできるようにする => ファイルサイズを小さく

容量はAのファイルサイズを小さくした時点と同等。
しかしiPad上に持って行くと軽快に動作する。

謎は深まるばかりです。

結論

  • 600dpiで読み取る
  • 白黒
  • 圧縮しない
  • 検索できるようにする(OCR) => ファイルサイズを小さく、の順で処理

まあ最初から電子書籍なPDFにはかなわないんだけど。
そのために最近は電子書籍が多い洋書に手を出して1ページ5分くらいかけながら読んだりしてます。
自炊なんてしなくて済むのが一番。

しかし軽いはずの最初から電子書籍なPDFでもGoodReader以外のアプリを全て終了させないとページをめくったときに待たされることが多く、iPad2に期待を寄せる日々だったりします。
(まあ、全て終了させれば問題ないんだけど)