Coppell Technologies

スマートシティの標準規格

Menu

Coppell Technologies (Top)
Fiwareで都市OSを動かしてみよう
NGSI-LDにも挑戦
データ仕様の現状と課題

スマートシティの標準規格

データモデルのユースケース

Column
Link集
用語集

Coppell

Technologies

 1. 標準規定の種類


標準規定の種類
2022-09-19
 「スマートシティにおけるデータの共通化」の第一章に記載した、データ交換に必要な規定の種類の一覧を転載します。この様に多くの種類の規定が必要なので、本書で章を分けて記載していきます。
分類 説明
文字セット どの様な文字を使って良いかの取り決めです。日本では、6万種ほどの漢字があるとされていますが、その内1万文字ほどがJIS X 0213で決められています。また、国際的にはUnicodeというものが決められていて、日本語だけでなく世界中の文字を定めています。JIS X 0213は、2002年に制定されたUnicode 3.2に反映されており、現在はUnicodeを採用する事はJIS X 0213に準拠することが可能である事を意味します
符号化方式 文字をコンピューター上でどの様に表現するかの取り決めです。かこ、ASCII、SJIS、EUCなど多くの方式がありましたが、現在はUTF-8という方式が標準となっています。世界のインタネット上のサイトのが実に95%がUTF-8を採用しており、日本でも80%のサイトが採用しています。調べてみた限りでは、政府機関のホームページの符号化方式はUTF-8でした。
語彙 例えば「住所」は「都道府県」「市区町村」「郵便番号」等々から構成されるなど、語の意味・構造・他の語彙との関係などを明確にしたものです。日本では、コア語彙というものが策定されています。
呼出しインタフェース プログラム間で相手を呼び出す手順や方法です。インターネットの世界では、WebAPIという方式が広く使われています。例えば、WebブラウザからWebサーバへの問い合わせは、この方式です。
情報モデル (下に出てくる)各データモデルをどの様な構造とするかの取り決めです。二階層、三階層、データモデル間の関係の有無などを取り決めます。例えば、NGSI v2という名前の規約では情報モデルは三階層で、NGSI-LDという規約では不定階層でありかつデータ間の関係が定義されています
データ形式 どの様な「文法」で情報を表現するかの取り決めです。例えばWebの場合は、htmlという形式で書いてあります。インタネットでは、JSONという形式が採用されている場合が多いです。この他に、Excelなどの表計算ソフトと親和性が高いcsv形式やXML形式などがあります。
データ
モデル
データモデル名 データモデルの名称です。データを受け取った場合、この名称で何のデータなのかを区別しますので、名称も共通化しておく必要があります。
データ構造 データがどの様な項目から構成されているかをデータ形式に従って決めたものです。項目名や項目の値をどの様な表記で記述するかなどが含まれています
データ間の関係 データ間の関係の取り決めです。例えば、「”公共施設”には必ず”自治体”などの公的な法人が対応し、N対1の関係がある」、や「"部屋"は必ず"建物"に対応し、N対1の関係がある」などの取り決めです
項目 項目名 項目に与える名称です。例えば、"市役所"のデータに含まれる所在地情報の項目名を「住所」とすべきか「所在地」とするか、統一されていることが望ましい訳です。
表記 ID、数値、文字列、日付、時刻、曜日、電話番号などをどの様に表現するかの取り決めです。数値の場合は桁数や精度、および単位も定めがある場合もあります。
単語 同義語がある場合、どの単語を使うかの取り決め。例えば、「やまい」と「病気」と「疾病」、「住所」と「所在地」、「塩竈市」と「塩釜市」などです。例えば住所の場合は、政府が進めているベースレジストリの整備の中で「 町字マスターデータセット」とうものがあり、これを見ると「塩竈市」が正しいことが分かります
コード 値を数値や短い文字列などのコードに置き換えて格納する際の取り決めです。コードとしては例えば、ISO 5218で性別:に対応するコードが決められていたり、ISO 3166 1 alpha 2で国コードや2文字や3文字のアルファベットでの表現が決められたりしています。
列挙型メンバ 値として、どの様な値の格納を許すかの取り決めです。例えば、性別は「女」「男」「不明」「その他」の4種類に限定するなどの取り決めがあります。

 尚、リンクトデータと呼ばれるデータ表現の揺れの少ないデータ交換をする際には、インタネット上の環境も必要です。例えば以下の様なものがあります。本書では、デジタル庁の推奨モジュールのインタフェースを前提とするため、必要ではないため、記載は省略します。

環境の種類 説明
語彙のIRI Linked Dataを利用するデータ交換の場合(NGSI-LDなど)、データモデル名、データ項目名、データの値などにIRI(通常はURL)を利用して、データの送り手と受け手間の齟齬の可能性を低減します。このため、IRIが定義されている事が必要です。後述しますが、今回の提案はNGSI V2ですので、IRIの定義は不要です。但し、将来LDに移行する事を考慮し、IRIについても提案します。
Contextファイル Linked Dataを利用するデータ交換の場合(NGSI-LDなど)、IRIの短縮名などを定義した@contextファイルがインタネット上に公開されている必要があります。前項同様が、今回の提案はNGSI V2ですので、Contextの定義は不要です。但し、将来LDに移行する事を考慮し、Contextについても提案します。