Coppell Technologies

スマートシティの標準規格

Menu

Coppell Technologies (Top)
Fiwareで都市OSを動かしてみよう
NGSI-LDにも挑戦
データ仕様の現状と課題

スマートシティの標準規格

データモデルのユースケース

Column
Link集
用語集

Coppell

Technologies

 2. 文字セット


1.1 UNICODE
2022年7月24日
 スマートシティのデータ交換の文字セットはUNICODEを採用します。
 正確に言うと、UNICODEは次章の符号化方式についての標準も含みますが、本論では理解しやすい様に別の章に分けています。
 UNICODEはゼロックスが提唱し、MicrosoftやApple等が参加し、その後非営利法人「Unicode Inc.」が設立され、その後はこの法人がISO等の標準と協力しつつ標準化を進めています。興味のある方はこちら
 以下、UNICODEの取り決めの内容です。

■抽象文字集合
 抽象というと難しそうですが、要するに文字の集まりという意味です。世界中の文字が登録されており、古い文字や絵文字なども登録されています。日本語は、JIS X 0213により文字集合が決められていますが、2002年にUNICODE3.2で吸収されています。興味がある方は、前記のUnicode Inc.のリンクをクリックしてみて下さい。

■符号化文字集合
 前記の抽象化文字集合に番号を与えたものです。標準の上ではこの番号で文字は区別されます。番号は最大24ビットを16進の数値6桁で表します。各値をコードポイントと言います。例えば、"a"は"U+0061"のコードポイントを与えられています。尚、抽象文字集合にはない制御文字にもコードポイントが与えられています。
 UNICODEでは、16ビットで表現できる第0面(基本多言語面)と16ビットより長いビット数が必要な第1面から第15面があるが、処理系やコンピューター言語によっては第0面以外に対応できない場合があり、使用は避けた方がよいという記述もみられる。現時点でどの程度障害が残存しているか筆者は把握していません。