2008-01-23から1日間の記事一覧

認証サイトのcrawler

無事にCrypt::SSLeayがインストールできたので、当初の目的のスクリプトを作成。 use strict; use LWP::UserAgent; use HTTP::Cookies; my $ua = LWP::UserAgent->new; my $url = 'https://www.example.com/login'; my $req = HTTP::Request->new('POST' => …

HTTP::Responseのis_hogehoge

PerlのHTTP::Responseモジュールだがis_successというメソッドがある。 前回のHTTPSのクローラーでも正常な通信の判定に利用していたが、これに落とし穴が。 サーバーが302のMoved Permanentlyを返した時にFALSEとなるのである。CPANにあるドキュメントを読…

SubVersionで更新があったファイルのみ抽出

パッチじゃなくてそのまま上書きすればいいように、ディレクトリ構成を保持して更新ファイルを抽出したかった。 manを読むと、 $ cp -RP でもいけそうに思えたが、全ファイルが同じディレクトリにコピーされてしまった。 探してたらcpioなるコマンドが見つか…

trunkをbranchにmerge

branchで作業しててtrunkの修正をmergeしたいことがある。 手順をいつも忘れるので備忘のために。 $ cd work-directory/branch $ svn merge -r xxx:yyy https://example.com/repos/hoge/trunk/ . branch作業してるワークディレクトリで上記コマンドを。 xxx…

HTML5の草案発表

W3CのHTML Working Groupから最初の草案が発表されました。 W3C Publishes HTML 5 Draft, Future of Web Content(W3CのPR日本語) http://www.w3.org/2008/02/html5-pressrelease.html.en Web コンテンツの将来を担う HTML 5 草案を公開(W3CのPR日本語1/23付)…