Perl: HTTPリクエストでWebページを取得する
CPANモジュール逆引きガイド
HTTP リクエストを発行して Web ページ(Web コンテンツ)を取得するための CPAN モジュール。
Furl
Furl は速度重視の httpクライアントモジュール。スレッドセーフな read timeout が実装されているので安心して利用しやすい。(自分は基本的に Furl を利用していて、Furl で難しい場合のときだけ LWP::UserAgent を使ったりする)
LWP::UserAgent
LWP::UserAgent は Perl httpクライアントモジュールの定番。
URI::Fetch
URI::Fetch は Last-Modified や ETag に対応した httpクライアントモジュールで、gzip 転送にも対応しており、サーバサイドやネットワークに優しいリクエストが行える。 feeds (RSS, Atom) の取得を目的に書かれたようす。
HTTP::Tiny
簡単な http クライアントが欲しければ HTTP::Tiny。ドキュメントに記述がありますが、HTTP::Lite より HTTP::Tiny 使っとけ、って感じらしい。
LWP::Simple
LWP::Simple も簡単な http クライアントのひとつ。getprint "URL"
という関数が便利。
WWW::Mechanize
WWW::Mechanize はブラウザエミュレートな httpクライアントモジュール。ある webサイトに対してブラウザアクセスを模した操作を行える。