Coppell Technologies データ仕様の現状と課題


スマートシティの標準規格
データモデルのユースケース

Column
Link集
用語集

Coppell

Technologies

3. 国内の標準類



3.1 GIFの規定類
2022-05-29/2023-01-05
 一部繰返しになりますが、改めて「政府相互運用性フレームワーク(GIF: Government Interoperability Framework)」について記載します。GIFは政府のシステムを対象としていjますがが、政府とデータをやりとりする自治体も参照する事を念頭に作られています。従来から行われてきたIMIや推奨データセットなどの活動をデジ庁で統合した活動で、プロジェクト名はIMI2(あいえむあいつー)とのことですが、以前の資料では「意味ツー」としていた記載もあった様に覚えています。IMIを引き継いでいるため、標準ではなく、参照モデルになっています。一方、自由に改変するなとの記載もあり、実質的な標準の考えられます。
 GIFには以下の参照モデルやガイドラインなどが含まれています。

名称 説明
コア語彙 政府が整備したデータ定義集である「共通語彙基盤」の中核をなすのがコア語彙です。GIFの記載によると「社会の活動は、ほぼこのコア語彙を使って表現することができます」とあります。コア語彙には氏名・日付・住所など61の語彙が登録されています。
残念ながら、コア語彙は多様な表記を可能にするためデータ項目が細かく細分化され定義されいます。例えば住所を示す「住所型」では国を国名でも国コードでも表現できるように両方とも定義してあります。また、「日付型」ではISO等の定義に従った表現も、年月日をバラバラの項目に分けて表現する方法も、更には元号による表現も定義してあります。データ交換する場合には表記の揺れを排除したいので、このコア語彙をベースにステークホルダー間でデータ項目の取捨選択を事前合意して実装用のデータモデルを整備していく必要があります。
コアデータパーツ 日付やアドレス等、多くのデータに共通的に含まれるデータ項目のデータ形式を定義しています( -- GIFの記載より転記)。日付時刻、住所、郵便番号、地理情報(座標)、および電話番号の5種類のパーツを定義しています。例えば、日付の場合コア語彙では多様な表現を許していましたが、コアデータパーツではISO標準に合わせた記述を選択しています。
コアデータモデル 人、施設等、社会で汎用的に使えるデータモデルを、コア語彙、コアデータパーツなどを組み合わせて定義しています。また、連絡先やアクセシビリティ情報等、ブロック化して各データモデルに組み込んで使えるデータの集合を切り出してデータモデルとして定義しています( -- GIFの記載より転記)。
実装データモデル(行政) サービスに組み込む場合に、「施設」のデータ項目に「学校種別」等の情報を拡張して「学校」とするなど、実際の使用目的に応じて作成したデータモデルです。このデータモデルが、ベース・レジストリやその他の実際のデータ整備に使われます( -- GIFの記載より転記)。
実践ガイドブック GIFの推進をするために、実践方法を解説した文書です。以下の文書が含まれています。
  • 文字環境導入実践ガイドブック[改定(新ISO反映)]
  • マスターデータ等設計・活用実践ガイドブック[改定]
  • コード(分類体系)設計・活用実践ガイドブック[改定(QRコード等追記)]
  • API設計・活用実践ガイドブック[改定]
  • APIテクニカルガイドブック[4月以降改定予定]
  • データマネジメント実践ガイドブック[新規]
  • データ人材管理実践ガイドブック[ベータ版から正式化]
  • データアーキテクチャ管理実践ガイドブック[新規]
  • データ品質管理実践ガイドブック[ベータ版から正式化(簡易測定を追加)]
  • メタデータ設計・活用実践ガイドブック 
コード一覧 各種コードの一覧が掲載されています。



3.2 GIF以外のデータ交換に影響がある規定類
2022-05-29/2023-11-20
以下、GIFに記載されている、GIF以外の相互運用性を確保するための主なルールです。下記の記載内容はGIFの記載内容です (原文ママ) 。

名称 説明
政府標準利用規約 政府標準のデータの利用規約です。この規約を使うことで、複数組織のオープンデータの利用条件を容易に確認できます。ただし、各部局が独自の変更を加えている場合があるので、実際には利用規約の確認が個々に必要になります。
個人情報保護条例 地方公共団体毎に個人情報保護条例が独自に作られて相互運用性の検討を難しくしていましたが、令和3年改正個人情報保護法の改正で全国的な共通ルールを規定し、全体の所管を個人情報保護委員会に一元化することで検討が進められています。
API利用規約 「スーパーシティのデータ連携基盤に関する調査業務」技術報告書 のAPI利用規約が活用できます。API導入実践ガイドブックに掲載されています。

この他に、以下も相互運用性の確保に関係します。

名称 説明
推奨データセット デジ庁が公開している、自治体が取り込むべきデータセットと、各データセットのひな形を提示しています。尚、推奨データセットはGIFに含まれている可能性があります。GIFのWebページには推奨データセットを掲載していませんが、GIFの説明の図ではす推奨データセットもGIFに統合する様に描かれています
行政データ連携標準 GIFで参照されている規定のひとつ。「行政基本情報データ連携モデル」の呼称。日付時刻、住所、郵便番号、地理情報、電話番号、POIコード、POIコード一覧の規定が含まれます
JIS X 0213 国内で使って良い文字の一覧です。この様な文字の全体集合を文字セットと呼びます。約1万の文字が掲載されています。この標準は、グローバルな文字セットであるUNICODEに引き継がれ、UNICODEの3.2で全て包含されています。つもり、UNICODEを準拠していれば、JIS X 0213に準拠している事になります
DCAT-GOJ W3C の定義するデータカタログのメタデータの標準である DCATを日本向けに拡張したものです
i-都市再生技術仕様案 政府により策定されているCityGMLの拡張仕様です。 PJ Plateauなどに対応して、順次拡張されています
スーパーシティ/スマートシティにおける「データモデル」に向けた調査 「2021年度 スーパーシティのデータ連携等に関する調査業務」で、内閣府から一般社団法人データ流通推進協議会(現データ社会推進協議会)に委託した業務に対する報告書です。ここに実装データモデルの調査結果として、土地、建物、施設、設備、道路、POI、交通、イベント、センサーデータ、地下街、地下埋蔵物、移動オブジェクト、自然、緊急情報、行政情報、意見・苦情、農業、エネルギー、その他のデータモデルや既存の規定類が記載されている。また、データカタログ、コード、idなどについても記載がある
データ連携基盤に求められる互換性・安全性・プライバシーに関する事項 内閣府から発行されている、確認すべき事項の一覧表です。各事項について元となる文書名が辿れる様になっているので、便利な資料です



3.3 推奨モジュール
2022-08-15
 7月4日に一般社団法人データ社会推進協議会が「推奨モジュール」を発表しました。この活動は、政府のデジタル田園都市国家構想に紐づいた活動であり、エリア・データ連携基盤のデータ仲介機能を担うモジュールです。モジュールは二つあり、Fiwre/OrionとKongです。Fiware/Orionの詳細については、本書の「Fiwareを使って都市OSを動かしてみよう」に記載しました。
 これがデジタル庁のお墨付きで発表されたことで、必然的に文字セットがUnicode、符号化方式がUTF-8、呼出し方式はNGSI-V1/V2のどちらか、情報モデルはNGSI、データ形式はJSONと確定しました。この他に時刻や地理座標などの各種値の表記や、データセット名やAttribute名の表記ルールも確定する事になります。
 尚、ここで留意が必要なのは、:現時点では推奨モジュールにはFiware/Orion-ldが掲載されていない点、および翻訳機能が掲載されていない点です。どちらも、予定も公表されていません。このため、NGSIの最新規格であるNGSI-LDの将来的な採用を視野に置きつつ、NGSCI V2を前提とした検討が必要となります。また、翻訳機能が無いため、データモデルを厳密に一致させないとデータ交換ができないという課題が残りました。



3.4 コア語彙
2022-05-29
IMI (Infrastructure for Multilayer Interoperability:情報共有基盤)が定める共通語彙基盤に含まれる共通語彙の内、幅広い業務分野に共通する、基本的な語彙です。因みに、コア語彙ではないものはドメイン語彙および応用語彙と呼ばれますが、IMIでは作成も認証もしないとしています。
 コア語彙では、人・法人・建物など61の語彙(クラス)が定義されており、各語彙に含まれる属性(プロパティ)としては、住所・連絡先・Eメールアドレスなど232個が定義されています。但し、住所や連絡先に具体的にどんな値を設定するかについてのルールは、文字列とか、コードとか決めているだけで、具体的なルールはコア語彙では定めていません。例えば、時間帯(コア語彙では時差のこと)は文字列としているが、ISOに従うのか、実践ガイドブックに従うのかなどの記述はありません。
 尚、JSON-LDなどのLinked Dataで必要なIRI (URLを一般化したもの) の掲載がありません。また、掲載予定も公開されていません。このため、将来的にLinked Dataへの移行を考えたい場合は、コア語彙を採用する方法については、工夫が必要となる可能性があります。

■コア語彙(クラス)の一覧

人型、名称型、氏名型、住所型、連絡先型、電話番号型、組織型、業務組織型、法人型、人数型、構成員型、組織関連型、場所型、座標型、ID型、ID体系、型製品型、製品個品型、地物型、土地型、施設型、施設関連型、建物型、駐車場型、設備型、イベント型、活動型、関与型、数量型、容量型、面積型、重量型、長さ型、金額型、価格型、実体型、状況型、日時型、日付型、期間型、期間スケジュール型、イベントスケジュール型、定期スケジュール型、詳細スケジュール型、詳細スケジュール規則型、コード型、単位コード型、コードリスト型、アクセス型、アクセス区間型、概念型、事物型、参照型、記述型、サービス型、文書型、対象型、制約型、コード制約型、範囲制約型、期間制約型

■コア語彙の属性(プロパティ)の一覧

ID、地理識別子、販売業者ID、アクセス区間、アクセス関連、イベント料金、価格、金額、資本金、購入価格、代表者、座標データ書式、カレンダー、国コード、市区町村コード、住所コード、都道府県コード、コード種別、量種別、乗数、原産国コード、国籍コード、種別コード、性別コード、出生国コード、組織種別、施設関連、施設管理者、入数、収容人数、期間、利用可能時間、設備、時間、設置者、組織、関連組織、代理人、建物、駐車場、FAX番号、携帯電話番号、電話番号、有効開始日時、有効終了日時、開始日時、終了日時、消費期限、製造日、死亡年月日、竣工日、生年月日、構成員、名称、延べ面積、建築面積、敷地面積、連絡先、地理座標、氏名、担当者名、関与、所有者、住所、本籍、重量、場所、出生地、活動状況、開催場所、地物、始点、終点、設置地点、測地高度、高さ、長さ、幅、最高の高さ、発生日、開催日、開始日、事業年度、開始日、終了日、使用期限、賞味期限、設置日、設立日、通貨コード、単位、単位表記、Webサイト、画像、参照、自動認識ID、地図、標準型日付、標準型日時、数値、地下階数、地上階数、秒、月、時、収容台数、年、日、分、人数、Eメールアドレス、緯度、緯度経度書式、色、開催期日、外部利用可否、概要、カナ表記、キーワード、規制情報、区、国、形態、経度、原産国、号、国籍、サイズ、座標データ、参加方法、時間帯、識別値、事業種目、市区町村、始点備考、終点備考、種別、状態、使用方法、姓、姓カナ表記、製造者、姓名、性別、姓名カナ表記、姓名ローマ字表記、姓ローマ字表記、設置位置、説明、送付先、組織種別位置、対応言語、関与者、担当者役職、駐車場種別、丁目、通称、都道府県、名、内線番号、名カナ表記、名ローマ字表記、年号、バージョン、バリアフリー、番地、番地補足、販売業者、備考、表記、ビル番号、ビル名、ミドルネーム、ミドルネームカナ表記、ミドルネームローマ字表記、役割、役割コード、郵便番号、要約、略称アルファベット、利用者、ローマ字表記、路線、ロット番号、構造、主要用途、出生国、町名、通貨、発行者、部屋番号。方書、開始時間、終了時間、上位コード、下位コード、関連コード、日時、関連人員、面積、活動、提供者、参照先、表題、作成者、寄与者、日付、資源タイプ、記録形式、記録形式コード、出処、言語、権利管理、利用対象、利用方法、制約、制約コード、制約対象、上限値、境界を含まない上限値、下限値、境界を含まない下限値、年齢、身長、体重、メタデータ、記述