ハマログ

株式会社イーツー・インフォの社員ブログ

文字コード

ソフトウェア関係の仕事に携わる方ならきっと文字コードで面倒な思いをしたことがある方も多いのではないでしょうか?ソフトウェア開発に携わる方に限らずパソコン使う方なら文字化けしてサイトやファイルが見れないという経験をしたことがある方も多いと思います。

最近文字コードについて調べ事していておーと思ったことがあったので紹介します。

Unicodeでは「符号位置」という端的にいうと文字コード表の1マスを通常は1文字として割り当てられるのですが、Unicodeには「結合文字」という種類の文字がありこれを使うと複数の符号位置を利用して1文字を表現できるらしいのです。欧州言語で使用するダイアクリティカルマークという文字だと下記のように表現されるそうです。

U+00F1 = U+006E + U+0303で表現

日本語の濁点「が」なども同じように表現できます。

ここまではへーって感じなのですが、これを応用して絵文字も組み合わせで表現されているらしいのです。

ノートパソコンを使う女性はU+1F469(女性)とU+1488(ノートパソコン)をZWJ(Zero-Width Joiner)という制御文字で合成して表現される

のように絵文字も結合によって表現されているらしいのです。これちょっと感動して文字コードもうちょっと深追いしてみたい気持ちになりました。

でも、早く一つの文字コードに統一された平和な世界に住みたいです。


  to   2020年10月29日


関連記事

さくらレンタルサーバでディレクトリ一覧表示を制限する

さくらのレンタルサーバ設定していたら、index系のファイルが存在しないディレク…

Wordでエンコーディングを指定してhtmlファイルを保存する

気づいたら入社してそろそろ1カ月になろうとしてます。megです。 先日、Word…

Laravel4でForm::checkboxのチェック状態判定

laravel4にてForm::checkboxのチェック状態判定を行いました。…


← 前の投稿

次の投稿 →