ハマログ

株式会社イーツー・インフォの社員ブログ

文字コード

ソフトウェア関係の仕事に携わる方ならきっと文字コードで面倒な思いをしたことがある方も多いのではないでしょうか?ソフトウェア開発に携わる方に限らずパソコン使う方なら文字化けしてサイトやファイルが見れないという経験をしたことがある方も多いと思います。

最近文字コードについて調べ事していておーと思ったことがあったので紹介します。

Unicodeでは「符号位置」という端的にいうと文字コード表の1マスを通常は1文字として割り当てられるのですが、Unicodeには「結合文字」という種類の文字がありこれを使うと複数の符号位置を利用して1文字を表現できるらしいのです。欧州言語で使用するダイアクリティカルマークという文字だと下記のように表現されるそうです。

U+00F1 = U+006E + U+0303で表現

日本語の濁点「が」なども同じように表現できます。

ここまではへーって感じなのですが、これを応用して絵文字も組み合わせで表現されているらしいのです。

ノートパソコンを使う女性はU+1F469(女性)とU+1488(ノートパソコン)をZWJ(Zero-Width Joiner)という制御文字で合成して表現される

のように絵文字も結合によって表現されているらしいのです。これちょっと感動して文字コードもうちょっと深追いしてみたい気持ちになりました。

でも、早く一つの文字コードに統一された平和な世界に住みたいです。

  to   2020年10月29日


関連記事

node.jsフレームワーク「Adonis」(1)

Laravelの開発しやすさは良いがPHPは飽きた!! というわけで悶々とした日…

Laravel4.2のソフトデリート(論理削除)について

Laravel4.1で開発中のシステムをLaravel4.2にアップグレードしま…

PhpSpreadsheetとTcpdfでExcelファイルから日本語PDFを作成してみる(そして失敗する)

はじめに PDFの帳票をLaravelから作成したかったので、いろいろ試していま…


← 前の投稿

次の投稿 →