URLからPathを抜き出すには

Perl初心者のためのPerlノートです!

HTML/ CSS/ CGI-Perl/ JavaScript/ JavaApplet/ AccessUp/ Internet/ EnglishLearn/ ちゃいちゃん天使/ 天使メッセージ/ 飯田ワールド/ 結城ワールド/ プロフィール/ WEB相談室/ WEBアンテナ/ WEBリーダー/ 燈明日記/ yahoo

◆ はじめに

本ページは、私がPerlを習得した時(いや習得中)のノートです。

ごく普通の言語(COBOL,C,Java,VB等)を知っている人が、Perlをやり始めるといろいろと悩むことがあります。

それは、

です。

本ページは、そのようなハードルを一つ一つクリアにしていけたらと思います。

そして、本ページが何かのお役に立てれば幸いです。では、ごゆっくりご覧ください。

尚、ご感想、ご意見、誤字、脱字、間違い等がありましたら遠慮なくPerlノート掲示板へご指摘ください。

◆ サイト最新情報

◆ コンテンツ

2009-09-13 URLからPathを抜き出すには

URLは、RFC1738では、以下のようになっています。

HTTP URL は、以下のような形態を取る

http://<host>:<port>/<path>?<searchpart>

http://www.spencernetwork.org/reference/rfc1738-ja-URL.txt

以下にURLから<path>を抜き出す正規表現を書いてみました。


◆サンプル

use strict;
use warnings;

my $wkURL = 'http://d.hatena.ne.jp/chaichanPaPa/searchdiary?word=%2a%5bPerl%a5%ce%a1%bc%a5%c8%5d';

$wkURL =~ /^http:\/\/.*?(\/.*?)(\?|\Z)/;

print $1, "\n";
最短マッチの『.*?』がポイントですね。
はじめの『.*?』は『\/』までの最短マッチで、つぎの『.*?』は、『(\?|\Z)』までの最短マッチです。

追記:今回の場合は正規表現を使わないで、以下のようにURIモジュールを使った方がベターです。(tyruさんから教えていただきました)
use strict;
use warnings;
use URI;

my $uri = URI->new('http://d.hatena.ne.jp/chaichanPaPa/searchdiary?word=%2a%5bPerl%a5%ce%a1%bc%a5%c8%5d');
print $uri->path;

◆ おすすめ Perl本

■ 続・初めてのPerl 改訂版

『初めてのPerl』の次ぎに読むと吉です。

結構いいですが・・・、初心者にはちょっと難しいかもです。

■ 結城浩のPerlクイズ

この本には、ちゃいちゃんパパの小話しが載っています(謎)。

ある程度、Perlを理解している人には、たまらない内容になっています。さすが結城先生だな!

結城浩のPerlクイズ

■ 新版Perl言語プログラミングレッスン入門編

実は、私はまだ読んでいませんが、結城先生の本なので良くないはずがありません。

新版Perl言語プログラミングレッスン入門編

■ CGI&Perlポケットリファレンス (Pocket reference)

この本は、非常に役に立ちます。ちょっと調べるのに最適です。サンプルも説明も的を射ています。

CGI&Perlポケットリファレンス (Pocket reference)

■ Perlベストプラクティス

一読の価値有りだと思います。

Perlベストプラクティス

■ プログラミングPerl〈VOLUME1〉

ご存知、Perl本の聖書、ラクダ本(上)です。

■ プログラミングPerl〈VOLUME2〉

ご存知、Perl本の聖書、ラクダ本(下)です。

◆ おわりに

最後に、本ページが、何かのお役に立てれば幸いです。

尚、ご感想、ご意見、誤字、脱字、間違い等がありましたら遠慮なくPerlノート掲示板へご指摘ください。

HTML/ CSS/ CGI-Perl/ JavaScript/ JavaApplet/ AccessUp/ Internet/ EnglishLearn/ ちゃいちゃん天使/ 天使メッセージ/ 飯田ワールド/ 結城ワールド/ プロフィール/ WEB相談室/ WEBアンテナ/ WEBリーダー/ 燈明日記/ yahoo