デジタリストBlog

« 前の記事 | トップ | 次の記事 »

2005年05月28日

Google Desktop Searchとdat2htmlの強力コンボ

datファイルは情報の宝庫

datファイルというとwindowsの様々なログやデータを貯めたファイルという感じだけど、2ちゃんねるビューア使いにとってdatファイルというと2ちゃんねるのログを保存しておくテキストファイルの形式ということになる。

たとえばopen jane viewは数ある2ちゃんねるビューアの中でも主力の一つ(おそらくユーザー最多?僕もユーザーです)の2ちゃんねる巡回サポートアプリだが、このアプリケーションではこれまでに閲覧したスレのログはopen jane\logs\2chというフォルダ(たぶん個人差がある)に続々と蓄えられてゆく。

僕の場合はjane系ビューアを使い始めてかなり長いせいか、いまプロパティで確かめたところこのフォルダに8659個のファイルがあり、その容量は306メガバイトにもなっている。中身は画像などは一切無く、テキストデータだけで306メガの容量なんだからこれはすごい。フロッピーディスク220枚分の2ちゃんねるログが僕のパソコンのハードディスクには入っているということになる。基本的に興味のないスレは巡回しないはずなので、僕の場合はほとんどがパソコン関連の「ソフトウェア板・ハードディスク板・OS板・windows板・web制作板・webprog板」、そのほかはオークション板・クレジット板・金融板・株式板・先物板、それから本業に関係のある学問理系ディレクトリの一部、あとはニュース速報系と野球実況板のログ(こうやってみると結構あちこち巡回してるんだな)。

Google Desktop Search(以下GDS)はdatファイルを検索対象としてくれない

これだけ自分の興味のある板のログばかり集めていると、自分のパソコンのハードディスク内を検索するだけでかなりのことが調べられる。特に各板に必ず一つはある「スレ立てるほどでもない初心者の質問スレ」などのログはFAQの宝庫。わからないことがあればこの質問スレの過去ログをちょっと検索してやれば大抵のことが調べられるのだ。大学の一般教養時代のレポートでもお世話になった。

ところがパソコン内検索を仕事とするGDSはdatファイルを検索対象としてくれない。情報がそこにあるのがわかっているのに検索できないのはもどかしい。今後収集するログはともかく、これまでに集めたログの中にあるはずのテキストデータだけでも検索できないだろうか?GDSプラグインでGDS改造という手もあるけど、先日紹介したようにプラグインは外国で開発されたものがほとんどなので文字化けに悩まされるしなぁ。

とりあえずdatファイルをtxtやhtmlに。

ならば大量のdatファイルはGDSが読める形式のテキストデータに変換してしまおうというツールがdat2html。これはログの格納されているフォルダを指定すれば、ワンクリックで大量のdatファイルをhtmlやtxtに変換してくれる。とりあえずこれでdatをGDS対応の形式に変更しておくとちゃんとGDSもこれらの2ちゃんねるログを検索大量としてインデックスしてくれるので急場はしのげる。

これまでに集めた2ちゃんねるログを検索できるようになると調べ物に掛かる時間が短縮されて便利になりますよ!(僕はjane\logsフォルダの中にjane\logs\2chと並んでjane\logs\2xhhtmlをおくようにしてます。)


Tatsu's Toolbox(dat2html配布公式サイト)
http://members.at.infoseek.co.jp/tatsu01/

Posted at 2005/05/28(土曜日) 3:05

この記事を読んだ人はこんな記事も読んでいます

コメント





保存しますか?


Loading...

« 前の記事 | トップ | 次の記事 »

« 前の記事 | トップ | 次の記事 »