Ruby - UNIX MBOX 一意性検証! (2011-11-18)
今日は、UNIX MBOX メールデータを DB(MySQL) へ登録しようと考えた場合、そのメールが登録済みかどうかをチェックしなければなりません。 そのチェックをどうするかを考えた場合、メールサーバで一意に付けられる Message-ID をチェックする方法が考えられます。 しかし、転送メール等の場合は M...
今日は、UNIX MBOX メールデータを DB(MySQL) へ登録しようと考えた場合、そのメールが登録済みかどうかをチェックしなければなりません。 そのチェックをどうするかを考えた場合、メールサーバで一意に付けられる Message-ID をチェックする方法が考えられます。 しかし、転送メール等の場合は M...
当ブログでは久々の「ルービックキューブ」ネタです。 小学生時代から何度目かのマイブームです。 今回のブームは今までで最も気合が入っていて、スピードキュービングと呼ばれるものに結構ハマっています。 今までは「メガハウス」製の既製のキューブを使用していました。 (既製のものはステッカーがすぐ剥がれるので、「CSK...
WindowsXP + Ruby + MySQL で大量(あるテーブルでは数千万件)のデータを処理していると、以下のようなエラーが発生しました。 Out of memory (Needed 8164 bytes) MySQL 側の問題と思い、MySQL のログを確認してみると同じようなエラーを出力していまし...
UNIX MBOX (Thunderbird) メールデータを DB (MySQL) へ登録すべく、最近各種検証を行ってきました。 本文・添付ファイル抽出・デコード部分はとりあえず考えず、DB登録(保存)することだけを考えています。 ※使用する言語は Ruby を想定。 まずは、DB (MySQL) を設計しな...
今日は、もう一つ UNIX MBOX メールデータのヘッダの検証を行いました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 今までも、何度かヘッダのフィールド毎に検証したり、どんなヘッダで成り立っているのかを検証したりしてきました。 当ブログの過去約1ヶ月の “UNI...
(最近、ブログタイトルが似たようなものになっていますが、微妙に内容が異なっていますのであしからず) さて、今日は UNIX MBOX メールデータのヘッダの検証を行ってみました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 今までも、何度かヘッダのフィールド毎に検証...
今日は UNIX MBOX メールデータの本文の検証を行ってみました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 本文の検証と言っても、 Content-Type のタイプが “text”・未設定の場合のサブタイプ・文字コード・エンコード別の集計をしたり、 ...
Ruby で UNIX MBOX メールデータを解析していると、添付ファイル(厳密には添付ファイルとは言えないですが)に “pgp-signature” が設定されているものがありました。 (当方のデータには4件ほどあり、そのうちファイル名が設定されているものは1件でしたが) Ruby - UNIX MB...
今回は UNIX MBOX メールデータの添付ファイルを検証してみました。 (検証には Ruby を使用していますが、ソースまでは公開していませんのであしからず) 添付ファイルの検証と言っても、実際にどんなファイルが添付されているのかを検証したわけではなく、どのようにファイルが添付されているかを検証してみました。
11月になったので、先月10月分の当ブログアクセス状況を公開します。 毎月、そんなに変わり映えしないですが・・・