ハマログ

株式会社イーツー・インフォの社員ブログ

文字コード

ソフトウェア関係の仕事に携わる方ならきっと文字コードで面倒な思いをしたことがある方も多いのではないでしょうか?ソフトウェア開発に携わる方に限らずパソコン使う方なら文字化けしてサイトやファイルが見れないという経験をしたことがある方も多いと思います。

最近文字コードについて調べ事していておーと思ったことがあったので紹介します。

Unicodeでは「符号位置」という端的にいうと文字コード表の1マスを通常は1文字として割り当てられるのですが、Unicodeには「結合文字」という種類の文字がありこれを使うと複数の符号位置を利用して1文字を表現できるらしいのです。欧州言語で使用するダイアクリティカルマークという文字だと下記のように表現されるそうです。

U+00F1 = U+006E + U+0303で表現

日本語の濁点「が」なども同じように表現できます。

ここまではへーって感じなのですが、これを応用して絵文字も組み合わせで表現されているらしいのです。

ノートパソコンを使う女性はU+1F469(女性)とU+1488(ノートパソコン)をZWJ(Zero-Width Joiner)という制御文字で合成して表現される

のように絵文字も結合によって表現されているらしいのです。これちょっと感動して文字コードもうちょっと深追いしてみたい気持ちになりました。

でも、早く一つの文字コードに統一された平和な世界に住みたいです。

  to   2020年10月29日


関連記事

Laravel5.2のMulti-Auth

Laravel5.2がでました。大目玉の機能として、ついに認証にMulti-Au…

自動コードフォーマットは悪・・・?

コードを綺麗に保つ為に、普段から意識して書くのはもちろん、ツールを使ってフォーマ…

PHPのfile_get_contentsでエラーハンドリングする

PHPのfile_get_contents関数で、サーバ上のファイルを読み込むこ…


← 前の投稿

次の投稿 →