メールの文字化けは何故起こるのか?対策は?

日本語をコンピュータ上(インターネット)で扱うことに関しては、
古くから、文字化けの問題に悩まされてきたという歴史があります。

私が以前に、海外のエンジニアとお仕事をしていたときは、
英語圏では、文字コードや文字化けに関しては、
意外と無頓着というか、問題意識自体がないので、
あまり分からないそうでした。(うらやましぃ(笑))

ヨーロッパでは、ウムラウトやアクサンテギュなど、
特殊な文字が少しありますので、
Unicode系の文字コードが使われることが多いです。

このUnicode文字コードが
インターネットの多言語化の救世主であり、
標準的な規格になってきています。

一昔前の、Windowsが流行りだす前ぐらいから、
Windowsでは、Shift-JIS、
LinuxではEUC-JP、
が主流でした。

一方、それよりも昔から定められていたメールの規格では、
JIS(ISO-2022-JP)と言う文字コードが
標準的に使われていました。

昔の人たちのがんばっていたんだろうなーと思いますが、
規格が乱立しているだけに、通訳が大変で、
翻訳がうまくいかないと、
文字化けということが起きてしまうわけです。

例えば、
フランス語とイタリア語とドイツ語と、
飛び交っていたらわけが分からなくなりますよね(>_<)
(それと似たような感覚だというと分かりやすいでしょうか)

そんな困難な時代を経て、
ここ数年で、Unicode系の文字コード、
その中でも特にUTF-8が浸透してきました。

現在では、いろいろ調べた結果、
「UTF-8+BASE64」
がメールのエンコーディングとしては、
一番のオススメです。

なぜなら、UTF-8やUnicodeでは、
こんな顔文字も使えるからです。
⇒ლ(╹◡╹ლ) (๑◕∀◕๑) ( ◉◞౪◟◉)

かわいいですよね(笑)

ただし、まだ一部ではありますが、
古いパソコンやメールソフトなどを、
UTF-8に完全には対応しきれていない環境が残っていて、
文字化けしてしまうことがあります。

新しいメールソフトに入れ替えてもらえればよいですが、
なかなか難しいという人もいるとおもいます。

そのため、無難に行くのであれば、
メールで使用するエンコーディングは、
「ISO-2022-JPを7bitで符号化」
というのが良いのかもしれません。

これは古くから使われてきた規格なので、
対応していないメールソフトはほぼないためです。

ただ、顔文字とか特殊文字は使えなくなってしまうのが
少し惜しいところですが(^^;

以上から、以下の結論に落ち着きました。

・ごく一部の読めない人を切り捨ててでも、
 顔文字を使いたいのであれば、
 「UTF-8+BASE64エンコード」

・顔文字使わずに、無難にいくのであれば、
 「ISO-2022-JP+7bitエンコード」

(場合によって切り替えて使うべし)

コメントを残す

サブコンテンツ

このページの先頭へ