おなじみのワードで 「<title>毎日5分のパソコン教室</title> 」と文字を打って
シフトジス(SJIS)コードで テキストファイルとして保存します。

保存したファイルの中身を16進数で表示してくれるソフトを使って、のぞいてみます。

左側はファイルの中のデータが16進数で表示されています。
一行に16バイト分が表示されています。
右はそのデータをシフトジスの文字コードだとして、対応する文字を表示してくれています。
ちゃんと 打ち込んだ通りの文字が表示されています。
今度は ファイルの中のデータが EUC という文字コードであるとして対応する文字を右側に表示すると
英数字は読めますが、日本語の部分が崩れます。

さらに ファイルの中のデータが ユニコード という文字コードであるとして対応する文字を右側に表示すると
まったく意味不明。

同じデータが入ったファイルでも 扱い方を誤ると こんな格好になります。
メールやホームページなどを見たとき、たまに文字化けが起こるのは、
文字コードの種類の判定をソフトウェアが誤った時に起こります。
なぜ、誤るのか。
文書を作るソフトウェアと 文書を閲覧するソフトウェアとで ルールが完全には一致してないからです。
人のコミュニケーションでも 言葉の解釈が違ってトラブルになるのとよく似ていますね。
ツイート 


