ハマログ

株式会社イーツー・インフォの社員ブログ

文字コード

ソフトウェア関係の仕事に携わる方ならきっと文字コードで面倒な思いをしたことがある方も多いのではないでしょうか?ソフトウェア開発に携わる方に限らずパソコン使う方なら文字化けしてサイトやファイルが見れないという経験をしたことがある方も多いと思います。

最近文字コードについて調べ事していておーと思ったことがあったので紹介します。

Unicodeでは「符号位置」という端的にいうと文字コード表の1マスを通常は1文字として割り当てられるのですが、Unicodeには「結合文字」という種類の文字がありこれを使うと複数の符号位置を利用して1文字を表現できるらしいのです。欧州言語で使用するダイアクリティカルマークという文字だと下記のように表現されるそうです。

U+00F1 = U+006E + U+0303で表現

日本語の濁点「が」なども同じように表現できます。

ここまではへーって感じなのですが、これを応用して絵文字も組み合わせで表現されているらしいのです。

ノートパソコンを使う女性はU+1F469(女性)とU+1488(ノートパソコン)をZWJ(Zero-Width Joiner)という制御文字で合成して表現される

のように絵文字も結合によって表現されているらしいのです。これちょっと感動して文字コードもうちょっと深追いしてみたい気持ちになりました。

でも、早く一つの文字コードに統一された平和な世界に住みたいです。

  to   2020年10月29日


関連記事

自分のノートパソコンを手軽にハイスペックにする方法

みなさん こんにちは わが会社は色々な人がいて、いつもわいわい、にこにこで、時に…

VagrantとAnsibleで仮想環境のCentOS6.5にWordPress環境構築!WebサーバーはNginxですか?(後編)

遂に後編を書くときが来ました。 てるおです。 はいどーも! やることはもう決まっ…

AWSに設置したphpMyAdminにBasic認証を設定/特定のIPアドレスによる制限

AWSで、ELB→EC2の環境にphpMyAdminを設置しました。 yumコマ…


← 前の投稿

次の投稿 →