Recent Posts

ルービックキューブ - DaYan ZhanChi!  (2011-11-16)

当ブログでは久々の「ルービックキューブ」ネタです。 小学生時代から何度目かのマイブームです。 今回のブームは今までで最も気合が入っていて、スピードキュービングと呼ばれるものに結構ハマっています。 今までは「メガハウス」製の既製のキューブを使用していました。 (既製のものはステッカーがすぐ剥がれるので、「CSK...

MySQL - Out of memory 対策!?  (2011-11-14)

WindowsXP + Ruby + MySQL で大量(あるテーブルでは数千万件)のデータを処理していると、以下のようなエラーが発生しました。 Out of memory (Needed 8164 bytes) MySQL 側の問題と思い、MySQL のログを確認してみると同じようなエラーを出力していまし...

UNIX MBOX メールデータ用 DB設計!  (2011-11-12)

UNIX MBOX (Thunderbird) メールデータを DB (MySQL) へ登録すべく、最近各種検証を行ってきました。 本文・添付ファイル抽出・デコード部分はとりあえず考えず、DB登録(保存)することだけを考えています。 ※使用する言語は Ruby を想定。 まずは、DB (MySQL) を設計しな...

Ruby - UNIX MBOX ヘッダFrom行検証!  (2011-11-10)

今日は、もう一つ UNIX MBOX メールデータのヘッダの検証を行いました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 今までも、何度かヘッダのフィールド毎に検証したり、どんなヘッダで成り立っているのかを検証したりしてきました。 当ブログの過去約1ヶ月の “UNI...

Ruby - UNIX MBOX ヘッダ検証!  (2011-11-09)

(最近、ブログタイトルが似たようなものになっていますが、微妙に内容が異なっていますのであしからず) さて、今日は UNIX MBOX メールデータのヘッダの検証を行ってみました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 今までも、何度かヘッダのフィールド毎に検証...

Ruby - UNIX MBOX 本文検証!  (2011-11-07)

今日は UNIX MBOX メールデータの本文の検証を行ってみました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 本文の検証と言っても、 Content-Type のタイプが “text”・未設定の場合のサブタイプ・文字コード・エンコード別の集計をしたり、 ...

UNIX MBOX - 「pgp-signature」について!  (2011-11-05)

Ruby で UNIX MBOX メールデータを解析していると、添付ファイル(厳密には添付ファイルとは言えないですが)に “pgp-signature” が設定されているものがありました。 (当方のデータには4件ほどあり、そのうちファイル名が設定されているものは1件でしたが) Ruby - UNIX MB...

Ruby - UNIX MBOX 添付ファイル検証!  (2011-11-03)

今回は UNIX MBOX メールデータの添付ファイルを検証してみました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 添付ファイルの検証と言っても、実際にどんなファイルが添付されているのかを検証したわけではなく、どのようにファイルが添付されているかを検証してみました。

Ruby - UNIX MBOX 本文Multipart検証!  (2011-10-31)

いよいよ UNIX MBOX メールデータの本文部分の検証を行ってみることにしました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) メール本文は単純に1つの文章で成り立っているものだけではなく、添付ファイルがあったり、本文が複数に分割されていたりします。