WEB相談室

Webページ作成に関しての何でも掲示板です。

タイトル:Perlでの日本語の正規表現について(数字の抜き出し)

0:[投稿] つぐみ [2003/02/26 22:29 ][環境:UNIX UNIX]

PerlにてSOKETを使用してHTMLのソースの中の特定の文字列を
抜き出したいのですが、うまくいきません。

例えば
http://search.yahoo.co.jp/bin/search?p=%BC%D6
を読み込むと、HTMLソースの中に

カテゴリ:<b>1867</b>件

という文字列があります。
ここの1867を抜き出したいのですが、うまくいきません。

while (<SOCKET>){
   if(/カテゴリ:<b>(.*)<\/b>件 /){
     $num = $1;
   }
return($num);

読み込んできた内容を調べてみるとSOKET部分はちゃんと動いて
いるようで、ちゃんとHTMLソースも読み込んできています。
日本語が含まれている文字列の正規表現が良く分かっておらず、
こまっております。ご教授をお願いいたします。


1:[回答] 薫 [2003/02/26 22:37 ]

<b>と</b>の間を抜き出すなら
s/<b>(([^/])+)<\/b>/$num=$1/egi;
<b>と</b>の間が必ず数字なら
s/<b>(\d+)<\/b>/$num=$1/egi;
かな?
# ちょっと自信なし


2:[回答] 薫 [2003/02/26 22:38 ]

2行目訂正です
誤:s/<b>(([^/])+)<\/b>/$num=$1/egi;
正:s/<b>(([^<])+)<\/b>/$num=$1/egi;


3:[回答] 匿名万歳 [2003/02/28 10:50 ]

日本語を扱う場合は
http://www.din.or.jp/~ohzaki/perl.htm#JP_Trans
を熟読すると良くわかると思います。

googleなどの検索サイトで調べても、それなりの記事はでますね。
「Google 検索: perl 日本語 正規表現」
http://www.google.com/search?num=50&lr=lang_ja&q=%70%65%72%6C%20%93%FA%96%7B%8C%EA%20%90%B3%8B%4B%95%5C%8C%BB


4:[回答] 匿名万歳 [2003/02/28 10:58 ]

日本語のことは無視して、同じ事をもし私がやるなら、以下のように書くかもです。

while (<SOCKET>) {
   if (m!<b>(\d+?)</b>!i) {
       $num = $1;
       last;
   }
}
return $num;


5:[完了] つぐみ [2003/02/28 22:22 ]

薫さん、匿名万歳 さんありがとうございます〜。

ん〜勉強しなければ。


6:[回答] ぷざ [2003/02/28 22:36 ]

>>0
「ご教授」ってなんですか?


7:[回答] ぷざ [2003/02/28 22:37 ]

>>5
その前に日本語を勉強した方がよさそうですね(w


8:[回答] ぶざ [2003/03/01 08:46 ]

> 管理人さん

「ご教授をお願いいたします」っていうヴァカがいつまでも絶えないので,質問者のガイドラインで注意したらどうですか?


9:[回答] 管理人 [2003/03/01 10:05 ]

>その前に日本語を勉強した方がよさそうですね(w

http://jiten.www.infoseek.co.jp/Kokugo?pg=result_k.html&col=KO&sm=1&enc=SJIS&svx=980100&vers=644&qt=%8B%B3%8E%F6

日本語的には、間違ってないようですが...。


10:[回答] yuu [2003/03/01 13:37 ]

>>9

間違っているというか、適切ではないですよ。
`教授`は`専門的な学問や技芸を、一定の順序や規則などに基づいて教えること(または人)`で、`教示`は`具体的に、どうするのが良いかを教えること`です。ようするに、`教授`だと何らか一定の時間をかけて、それが身につくように働きかけることというわけですから、こういった掲示板での質問・回答のやりとり程度ならば「ご教示ください」とするのが適切でしょう。

しかし、なんでふつうに「教えてください」って書かないんだろうね。「教えてください」で何の問題もないじゃん。日本語的にも影響的にも。


11:[回答] B-Cus [2003/03/01 13:56 ]

>>10
> `教授`は`専門的な学問や技芸を、一定の順序や規則などに基づいて
> 教えること(または人)`で、`教示`は`具体的に、どうするのが良いかを
> 教えること`です。

これ、どこかの辞書に書いてありますか?

「教授じゃなくて教示だ」というのはよく見かけますが、大辞林を
見る限りでは「教授が間違い」と言い切るだけの根拠がないようで、
ほんとかなぁ? と思っています。
 教授 http://dictionary.goo.ne.jp/cgi-bin/dict_search.cgi?MT=%B6%B5%BC%F8&sw=2
 教示 http://dictionary.goo.ne.jp/cgi-bin/dict_search.cgi?MT=%B6%B5%BC%A8&sw=2


12:[回答] yuu [2003/03/01 15:43 ]

というか、間違いだとは言ってないのですが僕は。

「教えて道を授けてください[ご教授ください]」というほどではないから「やり方を教えてください[ご教示ください]」というくらいが適切だということ。

だからといっても、*本当に*「道を授けて欲しい」と思っている可能性もあるので、書かれたものをいちいち指摘するのも面倒くさい話だよねというかなんというか。

用例などの豊富な、手元の紙ベースの辞書を見たほうが良いでしょう。みんな(誰)でgooとかinfoseekとかにある辞書の用例だけを見て判断しているものと思われるので。


13:[回答] B-Cus [2003/03/01 16:52 ]

間違いなのか、それとも不適切という程度の話なのかは置いておくとして、

>>12
> 「教えて道を授けてください[ご教授ください]」

その「道を」というのはどこかの辞書に書いてありますか? もしわかるので
あれば、辞書名を教えてください。

> `教授`は`専門的な学問や技芸を、一定の順序や規則などに基づいて教えること(または人)`
> 「教えて道を授けてください[ご教授ください]」

にはなにかしらの根拠があるのか、それとも「個人的にはこういう感覚で
使い分けている」ということなのかを知りたいのです。


14:[回答] 必須 [2003/03/02 21:56 ]

「教示」ならば明らかに正しい用法なわけですが、

(1)〔「きょうし」とも〕おしえしめすこと。示教。「御―を賜りたく」

>>0 の「教授」が間違ってないと感じる人は、

1)0 1 (ア)児童・生徒に知識・技能を与え、そこからさらに知識への興味を呼び起こすこと。
(イ)専門的な学問・技芸を教えること。
「国文学を―する」「書道―」
(2)0 大学などの高等教育機関において、専門の学問・技能を教え、また自らは研究に従事する人の職名。助教授・講師の上位。

のどれに当てはまると思っているのでしょうか?

ひとつも当てはまらないから、正しい用法ではないんですが。


15:[回答] andi [2003/03/03 00:58 ]

以前「ここ」で同じ指摘がありました。
http://www.ybi.co.jp/koike/qa1500/qa1707.htm

さらに以前(とほほでですが)にも同じ話が。
http://tohoho.wakusei.ne.jp/lng/199909/99090097.htm


16:[回答] ・・ [2003/03/03 10:13 ]

>>14
(イ)専門的な学問・技芸

これに当てはまるかどうかってとこですね。
WEB作成が。


17:[回答] satos [2003/03/03 15:04 ]

>>5
話の流れで、「ご教授をお願いいたします。」が、
単に「教えてください。」ということと分かりそうなものなのに、
「ご教授ってなんですか?」と噛みついてみたり、
「ヴァカ」とか言えるその神経が、私には理解できません。
というか、意味を見出せません。

そもそも、正しい言葉を使う目的はなんでしょうか?
円滑なコミュニケーションを取るためではないでしょうか?
辞書に載ってる用法と違うからといって、いちいち揚げ足を取って
喜ぶことは、コミュニケーションの妨げにしかならないし、
正しい言葉を使う目的から外れるものだと思います。

つぐみさんの「ご教授をお願いいたします。」からは、
話の流れから、「失礼の無いよう丁寧に聞かないと。。。」という
思いがあるのだな。と私は取りました。
「教授」の使い方が正しいのか間違っているのかなど、この場面で
問題視する必要など無いと思います。
どうしても気になるんなら、主題が解決後に
「ちょっと話が逸れますが、ご教授というのは・・・」
といった感じで、柔らかく切り出せばいいのではないでしょうか?
それとも、人を罵倒しないと話ができないですか?

私は、言葉なんて時代とともに変化していくのだから、
前後の流れで意味が通じるものに対して、いちいち突っ込みを
入れるなんて面倒くさいな。。。と思ってしまいますけどね。
「ホームページ」という言葉のように。


18:[回答] satos [2003/03/03 15:07 ]

すみません。↑の投稿は>>6の間違いです。


19:[回答] よしだ。 [2003/03/04 08:53 ]

>>17
> 私は、言葉なんて時代とともに変化していくのだから、

何かの受け売りみたいな陳腐ないいまわしだな.
かといって,好き勝手な用法で使っていいものではあるまい.


20:[回答] satos [2003/03/04 11:15 ]

>>19
>何かの受け売りみたいな陳腐ないいまわしだな。

何か面白くないことでもありましたか?

>かといって,好き勝手な用法で使っていいものではあるまい.

それは場所によるでしょう。
少なくとも、ここはお気楽に質問・回答ができる
「Webページ(ホームページ)作成に関しての掲示板」であり、
使っている言葉が話の前後で意味の伝わるものに対して、
いちいち目くじら立てて指摘する場所ではないと思いますが?


21:[回答] RaspBerryJam [2003/03/04 12:05 ]

他の場所なら放置なんですがここの掲示板なのであえて書きます
日本語を全て正しく使える人って居るのですか?
私は使える自信ありません。私もご教授と言うからです

前後で解釈できればいいのでは?
間違ってるのを指摘するのはその人のためではあるかも知れませんが
いきなりヴァカってのはどうかと。
自分の頭の中で理解できればいいのでは?

どうしても日本語は正しくと言うのならお堅い所に行けばいいかと
堅苦しくなく質問できるこの掲示板には場違いかと思います
2chなんて適切だと思います
少なくとも管理人様は細かいことを気にする人では無いように思えます

>>17
のsatosさんと同じ事ですが

イメージ的にも
ご教授:すいませんが教えてください
ご提示:おねがい何か考えて案出してね
って感じがします
日本語は時代と共に意味が曖昧になってます

さわり なんてそうじゃないでしょうか?
物事の頭ではなく中心の部分と言う意味と言うのを
理解できていないというのが検索すればわかります
まだまださわりしか勉強してませんがとかよく見かけますし

オタクと言う単語も
知識があり、熱中している人の事をさすものだったと思いますが
現在の意味では見た目がキモイ人の代名詞みたいな使い方されてませんか?

『HPからDLしてきました』と言うのをどこかで見ました
普通に解釈すれば
ホームページでダウンロードと思いつきます
わざわざヒューレート・パッカードからデシリットルしてきました
と読む人はいるのですか?

三人に意味不明で伝わらなくても7人に伝われば十分だと思います
正しいと思った日本語が世間では既にただしい使われ方していない
何てことはよくある事ですよ
現在で伝わる事が重要です。間違った日本語だとしても……


22:[回答] ~_~ [2003/03/04 19:45 ]

いったい誰が「ご提示」なんて話したのか気になりました。


23:[回答] 提案者 [2003/03/04 20:51 ]

技術系全般にこの手のやり取りを良く見かけるけど、技術系だからこそ
言葉を正確にする必要が有ったりします。
初心者は知識が無くて初心者なのではなく質問の仕方が判らない初心者が
多いのも良くありがちなパターンです。
>>17

>主題が解決後に
も確かに正論だと思います。

で、問題は何処にラインを引くかだと思うので、この手の話題は別スレッドで
じっくりラインを見出してはどうでしょう?
自分はその議論に参加するつもりこそ無いですが、その結果を見極めたい気持ち
はあります。いかがですか?>皆さん


24:[回答] よしだ。 [2003/03/04 21:09 ]

ボウヤたち

「定義」なんていう言葉をふりかざして,大人になった気分になって自己満足するのはやめなよ. ちっともカッコよくないよ.


25:[回答] しなのむし [2003/03/04 21:10 ]

不適切な方がマジョリティなのはなぜですか?>Hit数
http://www.google.co.jp/search?num=100&hl=ja&inlang=ja&ie=Shift_JIS&as_qdr=all&q=%82%B2%8B%B3%8E%A6%82%A8%8A%E8%82%A2&lr=
http://www.google.co.jp/search?num=100&hl=ja&inlang=ja&ie=Shift_JIS&as_qdr=all&q=%82%B2%8B%B3%8E%F6%82%A8%8A%E8%82%A2&lr=

教授 => 教え授ける
教示 => 教え示す
どちらも悪く思えませんが。

# 辞書通りが逆に不自然な場合が口語においては多い。(と思う)


26:[完了] 管理人 [2003/03/04 21:45 ]

管理人です。
この辺で完了にしましょうか...。

本BBSでは、どちらでもいいけど、yuuさんが提案してくれた、
>>10
「教えてください」
を推奨と言うことで、よろしくお願い致します。


27:[完了] 謎の人R [2003/03/04 22:22 ]

完了済みですが、ひとつだけ
>>25
>不適切な方がマジョリティなのはなぜですか?>Hit数
「教示」より「教授」がたくさんヒットした結果を即「不適切な方がマジョリティ」と解釈するのはどうかと?
※「教授」という語自体が不適切ならともかく


28:[完了] しなのむし [2003/03/05 02:23 ]

>>27
>「教示」より「教授」がたくさんヒット
"「ご教示お願い」より「ご教授お願い」がたくさんヒット"です。
>即「不適切な方がマジョリティ」と解釈するのはどうかと?
いずれにせよ少々強引ではありますね。
それから言わずとも分かると思いますが、自分は「ご教授お願い」を不適切とは思っておりませんので。

>>26
>「教えてください」を推奨と言うことで、よろしくお願い致します。
初回投稿者の方は通常より丁寧ともいえる表現で質問しているのに
こう言ってしまうのは何かおかしくありませんか?


29:[完了] 謎の人R [2003/03/05 03:18 ]

>>28
>"「ご教示お願い」より「ご教授お願い」がたくさんヒット"です。
25の両リンク(をクリックして)見ればわかるので、あえて簡略化しただけなんですがねぇ?(^^;)

蛇足ながら触れておくと、ほかに
・ご○○→御○○
・お願い→御願い、おねがい
・あるは、○○いただければ

などなど、いろんなケースがあると考えられるのに、一例をもって「不適切な方がマジョリティ」とするのはかなり強引ではないかと。


ちなみに不適切云々については、自身の感じ方とは別に、相手によっては意図せぬ不快感を感じさせてしまう可能性もあるわけですから、文法的な使い分けに従うか、でなければ「教えてください」とするほうが無難かと個人的には思います。
※ここに限らず一般的な話として。いずれにしろ、>>10 に同意。


30:[完了] しなのむし [2003/03/05 09:01 ]

>>29
>いろんなケースがあると考えられるのに
もちろん色々なケースは試しましたよ。
で、結果をざっと眺めれば大体はっきりしていると思ったのですが
納得いかないのであればGoogleの例は忘れてくださって結構です。
(本当は、なぜ間違いと言われるところの用法が世に流布しているのか意見を聞きたかったのですが)

>相手によっては意図せぬ不快感を感じさせてしまう可能性もあるわけですから
つぐみさんの例で不快な感情を抱くというのが理解できませんね。
意味は通じいて、本人に悪意はなく失礼もなくて、国語が主たる話題ではない掲示板で
質問とは関係のない言葉使いについて親でも教師でもない人間に必要以上に突っ込まれることの方が
よほど不快ではないですか?

>文法的な使い分けに従うか
これにはっきりした根拠が見出せるようならとっくに終了している話題ではないですか?

>でなければ「教えてください」とするほうが無難か
なぜこのことに関し突然国語の教師のようなこだわりを見せるのか不思議でなりません。
過去に誰かにこのことを指摘された、文献を読んだ等の経験に立脚するものでしょうか?

>>12 >>13
「教示」というのは仏教関係でよくみかける言葉。
従って自分はこの言葉に軽いイメージはありませんし
「道」というのならこちらのイメージが強いです。(人生の道かな)
そしてWebページ作成に関しては学問よりのイメージがする「教授」がぴったりきます。


31:[完了] 謎の人R [2003/03/05 15:04 ]

>>30
>なぜ間違いと言われるところの用法が世に流布
説明不足でした。検索結果の中には正しく用いているケースもあるでしょうに、それを「Hit数の多さ=間違った用法が世に流布」と解釈するのはどうか?といいたかったのです。

いずれにしろこの手の話題はけっきょく根拠に納得するかどうかなんでしょうね。
※「お疲れ様」と「ご苦労様」の使い分けなどと同様


不快といえば、トピずれした話題を続けてしまったのは迂闊でした。この辺で終了します。


32:[完了] 必須 [2003/03/06 02:27 ]

> 不適切な方がマジョリティなのはなぜですか?>Hit数

国語力の低下です。報道番組ですら、漢字が読み間違いが日常的になっています。

> つぐみさんの例で不快な感情を抱くというのが理解できませんね。

あなたの理解力の無さを自慢しないように。

> 意味は通じいて、本人に悪意はなく失礼もなくて、国語が主たる話題ではない掲示板で
> 質問とは関係のない言葉使いについて親でも教師でもない人間に必要以上に突っ込まれることの方が
> よほど不快ではないですか?

よほど傲慢な人でない限り、誤りを素直に認めます。不快ではありません。
予期しない知識まで得られるのですから、私なら一石二鳥だと感謝します。

回答(必須): 状態:

お名前(必須):

e-mail:

URL:




[戻る]

ChaichanPAPA's World