ハマログ

株式会社イーツー・インフォの社員ブログ

文字コード

ソフトウェア関係の仕事に携わる方ならきっと文字コードで面倒な思いをしたことがある方も多いのではないでしょうか?ソフトウェア開発に携わる方に限らずパソコン使う方なら文字化けしてサイトやファイルが見れないという経験をしたことがある方も多いと思います。

最近文字コードについて調べ事していておーと思ったことがあったので紹介します。

Unicodeでは「符号位置」という端的にいうと文字コード表の1マスを通常は1文字として割り当てられるのですが、Unicodeには「結合文字」という種類の文字がありこれを使うと複数の符号位置を利用して1文字を表現できるらしいのです。欧州言語で使用するダイアクリティカルマークという文字だと下記のように表現されるそうです。

U+00F1 = U+006E + U+0303で表現

日本語の濁点「が」なども同じように表現できます。

ここまではへーって感じなのですが、これを応用して絵文字も組み合わせで表現されているらしいのです。

ノートパソコンを使う女性はU+1F469(女性)とU+1488(ノートパソコン)をZWJ(Zero-Width Joiner)という制御文字で合成して表現される

のように絵文字も結合によって表現されているらしいのです。これちょっと感動して文字コードもうちょっと深追いしてみたい気持ちになりました。

でも、早く一つの文字コードに統一された平和な世界に住みたいです。

  to   2020年10月29日


関連記事

テスト設計技法 – デシジョンテーブルテスト

どうもーyasuです~ そろそろ涼しくなってきたかな? 一つ報告、8/25にテス…

NetbeansのFormatをPSRに準拠させる

こんにちは、かねこです。 いま挑戦しているPHPのプロジェクトで、NetBean…

AWS環境で、EC-CUBEのtimezoneがおかしくなった話

~経緯~ 現在、案件でAWS環境でEC-CUEBの構築をしています。 テストで受…


← 前の投稿

次の投稿 →