Scrapingは楽しい

最近自分の中でScrapingが流行ってます。今まであまりWebサーバにアクセスして情報を集めるようなプログラムを書いたことがなかったので楽しい!

とかをcronで収集するようにしてみた => Tritonn検索データベースに入れてあとで検索。

あらためて各ページのHTML構造を見るといろいろ特色がありますね。idとかclassが振ってあると取りやすい。無いとあれこれロジックでカバーみたいな。