2024/02/13 22:13:39

Perl: HTTPリクエストでWebページを取得する

CPANモジュール逆引きガイド

HTTP リクエストを発行して Web ページ(Web コンテンツ)を取得するための CPAN モジュール。

Furl

Furl は速度重視の httpクライアントモジュール。スレッドセーフな read timeout が実装されているので安心して利用しやすい。(自分は基本的に Furl を利用していて、Furl で難しい場合のときだけ LWP::UserAgent を使ったりする)

LWP::UserAgent

LWP::UserAgent は Perl httpクライアントモジュールの定番。

URI::Fetch

URI::Fetch は Last-Modified や ETag に対応した httpクライアントモジュールで、gzip 転送にも対応しており、サーバサイドやネットワークに優しいリクエストが行える。 feeds (RSS, Atom) の取得を目的に書かれたようす。

HTTP::Tiny

簡単な http クライアントが欲しければ HTTP::Tiny。ドキュメントに記述がありますが、HTTP::Lite より HTTP::Tiny 使っとけ、って感じらしい。

LWP::Simple

LWP::Simple も簡単な http クライアントのひとつ。getprint "URL" という関数が便利。

WWW::Mechanize

WWW::Mechanize はブラウザエミュレートな httpクライアントモジュール。ある webサイトに対してブラウザアクセスを模した操作を行える。

See Also

サイト内検索