サムネイル画像のURLをWeb::Scraperで取得して、正規表現で本体のURLに変換して、MechanizeでDLというのを良くやるのですが、いちいちHPに応じて、URLを取得してくるコード(どこの、なんて名前のテーブルの内側にあるリンクを取ってこいとか)を書き直すのが面倒になってきました。画像を取得するだけだったら、全文検索でURLっぽいものを全て取得して、目的の画像群のURLと類似度が近いやつだけ片っ端からDLするってコードの方が楽かも。
0 件のコメント:
コメントを投稿