WINDOWS上のPerl漢字処理では、ソースコードは UTF-8 で I/O は Shift-JIS で・・・

Perl初心者のためのPerlノートです!

HTML/ CSS/ CGI-Perl/ JavaScript/ JavaApplet/ AccessUp/ Internet/ EnglishLearn/ ちゃいちゃん天使/ 天使メッセージ/ 飯田ワールド/ 結城ワールド/ プロフィール/ WEB相談室/ WEBアンテナ/ WEBリーダー/ 燈明日記/ yahoo

◆ はじめに

本ページは、私がPerlを習得した時(いや習得中)のノートです。

ごく普通の言語(COBOL,C,Java,VB等)を知っている人が、Perlをやり始めるといろいろと悩むことがあります。

それは、

です。

本ページは、そのようなハードルを一つ一つクリアにしていけたらと思います。

そして、本ページが何かのお役に立てれば幸いです。では、ごゆっくりご覧ください。

尚、ご感想、ご意見、誤字、脱字、間違い等がありましたら遠慮なくPerlノート掲示板へご指摘ください。

◆ サイト最新情報

◆ コンテンツ

2008-05-07 WINDOWS上のPerl漢字処理では、ソースコードは UTF-8 で I/O は Shift-JIS で・・・

WINDOWS上のPerl漢字処理の留意点

以下のサンプルは、ソースコードは UTF-8 で書き、utf8プラグマを指定し、I/O は Shift-JISにエンコードしています。

注意しなくてはいけないのは、ファイルI/Oでは、shiftjisのファイルを読んで内容をdecodeし、utf8上で任意の処理後、encodeする手順です。

なお、ここで云うdecodeとは、shiftjisバイト列(UTF8フラグなし)をUnicode文字列(UTF8フラグ付き)へデコードします。

また、ここで云うencodeとは、Unicode文字列(UTF8フラグ付き)をshiftjisバイト列(UTF8フラグなし)へエンコードします。


サンプルソース
use strict;
use warnings;
use Encode qw(encode decode);
use utf8;                             # ソースがutf8で書かれていることの宣言
binmode STDOUT, ':encoding(shiftjis)';# 標準出力はutf8からshiftjisへ変換
binmode STDERR, ':encoding(shiftjis)';# 標準エラーはutf8からshiftjisへ変換
binmode STDIN, ':encoding(shiftjis)'; # 標準入力はshiftjisからutf8へ変換

open(FH_IN, 'sjis_in.txt');
open(FH_OUT, '>sjis_out.txt');
while (<FH_IN>) {
    my $wk = decode('shiftjis', $_);  # shiftjisからutf8へ変換
    #ここで$wkに対して任意の処理をする。
    print FH_OUT encode('shiftjis', $wk); # utf8からshiftjisへ変換しファイル出力
}
close(FH_OUT);
close(FH_IN);
print "----------------------\n";
while (<STDIN>) {              # 標準入力からshiftjisを読み込むとutf8なっている
    print $_;                  # 標準出力にutf8を書き込むとshiftjisになっている
}
my $wk = '表示';
print unpack('H*', $wk), "\n"; # ダンプするとutf8コードになっている
print $wk;

とにかく、ソース記述コード、内部コード、外部コード、バイト列(UTF8フラグなし)、文字列(UTF8フラグ付き)が複雑に絡み合うので、混乱しないようにね。


参考:

◆ おすすめ Perl本

■ 続・初めてのPerl 改訂版

『初めてのPerl』の次ぎに読むと吉です。

結構いいですが・・・、初心者にはちょっと難しいかもです。

■ 結城浩のPerlクイズ

この本には、ちゃいちゃんパパの小話しが載っています(謎)。

ある程度、Perlを理解している人には、たまらない内容になっています。さすが結城先生だな!

結城浩のPerlクイズ

■ 新版Perl言語プログラミングレッスン入門編

実は、私はまだ読んでいませんが、結城先生の本なので良くないはずがありません。

新版Perl言語プログラミングレッスン入門編

■ CGI&Perlポケットリファレンス (Pocket reference)

この本は、非常に役に立ちます。ちょっと調べるのに最適です。サンプルも説明も的を射ています。

CGI&Perlポケットリファレンス (Pocket reference)

■ Perlベストプラクティス

一読の価値有りだと思います。

Perlベストプラクティス

■ プログラミングPerl〈VOLUME1〉

ご存知、Perl本の聖書、ラクダ本(上)です。

■ プログラミングPerl〈VOLUME2〉

ご存知、Perl本の聖書、ラクダ本(下)です。

◆ おわりに

最後に、本ページが、何かのお役に立てれば幸いです。

尚、ご感想、ご意見、誤字、脱字、間違い等がありましたら遠慮なくPerlノート掲示板へご指摘ください。

HTML/ CSS/ CGI-Perl/ JavaScript/ JavaApplet/ AccessUp/ Internet/ EnglishLearn/ ちゃいちゃん天使/ 天使メッセージ/ 飯田ワールド/ 結城ワールド/ プロフィール/ WEB相談室/ WEBアンテナ/ WEBリーダー/ 燈明日記/ yahoo

人のよいところをどんどん見つけよう