Ruby - PDF からテキスト抽出!  (2012-11-26)

Ruby を使って PDF ファイルからテキストを抽出する方法についての記録です。 ちなみに、直接 PDF からテキストを抽出するのなら、Xpdf や Poppler 等の pdftotext というコマンドを使用して以下のようにすれば可能のようです。(未確認) $ pdftotext test.pdf te...