|
|
|
|
2022年7月24日 |
|
スマートシティのデータ交換の文字セットはUNICODEを採用します。 正確に言うと、UNICODEは次章の符号化方式についての標準も含みますが、本論では理解しやすい様に別の章に分けています。 UNICODEはゼロックスが提唱し、MicrosoftやApple等が参加し、その後非営利法人「Unicode Inc.」が設立され、その後はこの法人がISO等の標準と協力しつつ標準化を進めています。興味のある方はこちら 以下、UNICODEの取り決めの内容です。 ■抽象文字集合 抽象というと難しそうですが、要するに文字の集まりという意味です。世界中の文字が登録されており、古い文字や絵文字なども登録されています。日本語は、JIS X 0213により文字集合が決められていますが、2002年にUNICODE3.2で吸収されています。興味がある方は、前記のUnicode Inc.のリンクをクリックしてみて下さい。 ■符号化文字集合 前記の抽象化文字集合に番号を与えたものです。標準の上ではこの番号で文字は区別されます。番号は最大24ビットを16進の数値6桁で表します。各値をコードポイントと言います。例えば、"a"は"U+0061"のコードポイントを与えられています。尚、抽象文字集合にはない制御文字にもコードポイントが与えられています。 UNICODEでは、16ビットで表現できる第0面(基本多言語面)と16ビットより長いビット数が必要な第1面から第15面があるが、処理系やコンピューター言語によっては第0面以外に対応できない場合があり、使用は避けた方がよいという記述もみられる。現時点でどの程度障害が残存しているか筆者は把握していません。 |
|