2003 年 9 月の履歴(もしくは日誌)


2003 年 9 月





9 月 22 日 コミュニケーション:その誤解と理解と容認と

Internet と日本語の文字コード

Web をはじめるに当たって,文字コードを何にするのが良いかという相談を受けることがありますが,ぼくは,今後は UTF-8 が有力かもしれないけど,現時点では Shift-JIS が 1 番無難だからお勧めですって答えています.

Perl という言語による日本語処理で,昔は EUC で処理するのが一般的だったんで,EUC で統一っていう考えもあるようです.今は Perl を使うにしても EUC にこだわらなくても大丈夫だと思うし,UTF-8 でも大丈夫でしょう.

ぼくが Web ページをはじめようと思った時は,まだ日本語の Web ページって少なかったんです.今のように Shift-JIS がこんなに使われるとぼくは予想していなくて,Internet でどのような漢字コードが標準として使われているのかを調べてみたんです.したら,電子メールでは JIS コードを使うのが標準となっていることが分かり,それならいずれ Web ページの日本語の文字コードが統一される日が来るとしたら,JIS が有力なのではないかと思ったのです.この予想はおおはずれでした.

Internet 上で Web を使ったコミュニケーションを考えた時に,他言語対応を考えたり XML の利用を考えたりしたら,UTF-8 はそれなりに魅力的です.日本語を UTF-8 で表現したら無駄に容量が大きくなったりするのかもしれないですけどね.

実は Web ページよりも,電子メールの文字コードが UTF-8 に移行しないものかと.日本語とドイツ語などを同時に扱う場合に,単一の文字コードで両方の言語で必要な文字を表現できるのは便利だと思うんです.

salt-style: 文字コードについてより引用:

RSSとかXML関係の技術を使ってるBLOGの場合はUTF-8にしとくのが無難かなーと思って見たり。

引用終わり

RSS などの XML の部分は UTF-8 がいいと思うけど HTML は,まだ UTF-8 でなく Shift-JIS なんかのほうが無難だと思います.使い分けも難しくないと思うし.

てなわけで,Column@nak の エンコーディング での @nak(あ)さんのつぶやき:

UTF-8がいいのだろうか・・・

引用終わり

については,EUC ではじめちゃったからしばらくそのままに運営してみたら良いのではないかと.

自分の Web ページを将来他の文字コードに変換することを考えると,ちょと面倒だなって思いました.それで,ぼくの JIS が標準になるだろうという予想が外れたことが明らかになったいまでも JIS のままだったりするんです.
そんなこんな...

TrackBack