2008年4月11日金曜日

Web::Scraperは便利だけれど


このエントリーをはてなブックマークに追加


サムネイル画像のURLをWeb::Scraperで取得して、正規表現で本体のURLに変換して、MechanizeでDLというのを良くやるのですが、いちいちHPに応じて、URLを取得してくるコード(どこの、なんて名前のテーブルの内側にあるリンクを取ってこいとか)を書き直すのが面倒になってきました。

画像を取得するだけだったら、全文検索でURLっぽいものを全て取得して、目的の画像群のURLと類似度が近いやつだけ片っ端からDLするってコードの方が楽かも。





0 件のコメント:

コメントを投稿