2008-05-16 Scrapingは楽しい 最近自分の中でScrapingが流行ってます。今まであまりWebサーバにアクセスして情報を集めるようなプログラムを書いたことがなかったので楽しい! Hatena::Diaryの気になるidの人 MySQL日本ユーザ会のメーリングリストログ とかをcronで収集するようにしてみた => Tritonn検索データベースに入れてあとで検索。あらためて各ページのHTML構造を見るといろいろ特色がありますね。idとかclassが振ってあると取りやすい。無いとあれこれロジックでカバーみたいな。