業務システムでよく使うファイルフォーマットがPDFではないかと思います。よく使うだけにPDFをベースにして別な使い方を考えたいのですが、なにぶん再利用性がとても悪いフォーマットでもあります。
そこで使ってみたいのがOrigamiです。OrigamiはRubyで作られたPDFを操作するライブラリです。
Origamiの使い方
Origamiが提供するコマンドの一群です。
pdf2graph
pdf2pdfa
pdf2ruby
pdfcocoon
pdfcop
pdfdecompress
pdfdecrypt
pdfencrypt
pdfexplode
pdfextract
pdfmetadata
pdfsh
pdfwalker
解析する系のライブラリが多いのですが、その中にpdf2rubyというのがあります。実行するとPDFを生成するRubyコードができあがります。
他にも画像やフォント、テキストなどの解凍ライブラリもあります。
何かPDFファイルがあれば、それをOrigamiを使って解析すれば、プログラムから使いやすくなります。他にも暗号化や復号化、非圧縮などのライブラリがあります。PDFを操作する際には参考になる点が多いかと思います。
OrigamiはRuby製のオープンソース・ソフトウェア(LGPL)です。
cogent/origami-pdf: Origami is a Ruby framework designed to parse, analyze, and forge PDF documents.
MOONGIFTの関連記事