≪6≫自治体におけるデータマネジメントの未来像 福田 次郎 最高情報統括責任者補佐監 〈経歴〉  民間シンクタンク会社において、ICT分野をはじめとする数多くの調査研究、新システム・新ビジネスの企画、立ち上げなどに参画されたのち、平成27年4月に横浜市の最高情報統括責任者(CIO)補佐監として入庁。  新市庁舎移転を契機とした業務の効率化や働き方の見直しに向けたしごと改革推進本部とその関連プロジェクトにおける検討のほか、平成29年4月に設置したオープンイノベーション推進本部においても、ICTの専門的知見から先導している。  最高情報統括責任者(CIO)補佐監は、情報化による市民の利便性の向上及び行政運営の改善に関する事項を所管する最高情報統括責任者(CIO)を補佐する者として平成19年度に設置され、専門的な見地から、情報化施策に関する検討、立案等を行う役割を担う。 (編集部注)  本稿では、データ活用の全体像を整理して俯瞰し、自治体を中心としたデータ活用の将来性と、自治体におけるデータマネジメントの未来像について紹介します。 1 広がりをみせるデータ利用空間  IoTなどのデータ収集・連携技術や、AIなどの分析・予測技術の進展によって、データ利用空間はこれまでにない広がりを見せています。データの活用は、「過去」の状況を示すデータだけでなく、刻々とリアルタイムに変化する「現在」、予測される「未来」という時間の軸、行政から医療・福祉、インフラ、商業など多様な分野での利用の軸、さらにネットワークや匿名化処理の技術などのデータ連携技術やAI、データサイエンスの進歩によるビジネス化の軸の広がりにより、大きなビジネス・活用シーンを形成しつつあります。(図1)  その空間内で流通するデータも、従来の統計的な集計結果のデータだけでなく、施設や個人に関連する情報に由来するもの、センサー等により収集されるものなど、多様な発生源があり、データの形式も、数値データだけでなく、属性情報(メタデータ)や、計測データ、位置データなど、多様化していきます。  自治体の保有するデータも、そのデータ利用空間の中で流通し、活用される重要な構成要素です。その活用場面は大きく、企業・市民による活用と、自治体内での活用に分けられます。 2 企業・市民によるデータ活用  企業・市民によるデータ活用では、自治体から提供されるオープンデータに大きな期待が寄せられています。しかし、これまでのオープンデータの取組では、自治体が企業・市民のニーズに十分応えていないとの指摘もあり、自治体が提供するデータと、求められているデータとの間にギャップがあったと考えられます。  企業・市民が求めるデータとは、次のようなものが考えられます。 @生のデータ 集計など加工されていない、元のデータ。 A新鮮なデータ 古くない、現時点での最新のデータ。 B信頼性のあるデータ 重複や誤りのない正確なデータ。 C収集の手間がかからないデータ 民間で収集すると手間や費用がかかるデータ。 D転用が楽なデータ データの読込やタグ付けが簡単なデータ。著作権的に転載が可能な無償のデータ。 E価値のあるデータ 空きがある保育園情報など、最終的な利用者(エンドユーザー)が欲しているデータ。  自治体においては、こうしたデータを提供できるように心がけるとともに、業務やそのシステム設計においても、利活用を想定したデータの管理が求められています。  特に一人ひとりの個人に関連するデータは、医療分野や消費活動につながる行動解析の分野などにおいて企業の需要が高く、今後、非識別加工情報の提供が求められることが想定され、その対応の準備が必要とされます。  また、行政サービスにおける手続きや情報検索においては、民間側のシステムから自治体のシステムに直接アクセスして、手続き操作や情報連携ができるよう、API(Application ProgrammingInterface)による連携が求められるでしょう。 3 自治体内におけるデータ活用  一方、自治体内部の業務においても、より進んだ形でのデータ活用が求められています。それは、施策の立案・実施におけるデータ活用と、内部管理業務におけるデータ活用です。 (1)施策の立案・実施におけるデータ活用  これまで施策は、業績評価(事業評価)の形で実施後に定量的な評価が試みられてきました。しかし、今後は、施策の立案段階、執行段階、実施後の各段階でそれぞれ、データによる評価が求められてきます。(図2)  施策の立案段階では、施策とその効果の因果関係について、データに基づく説明の取組( E B P M:EvidenceBased Policy Making) が必要とされます。事実に基づく数値や統計分析による現状把握とともに、因果関係の説明には、調査による自然実験結果の把握や、ランダム化比較試験( R C T:RandomizedControlled Trial) などで得られた試行実施による施策結果のデータが必要となるでしょう。  施策の実施段階では、施策の執行状況を管理するための「執行評価」や、実施後の効果を評価し次の予算や計画に反映するための「業績評価」が必要となります。  執行評価では、予算やスケジュールといった事前の計画に対してどれだけ実施したか、そのギャップを比較することによるプロジェクト管理が求められます。各施策(プロジェクト)において、経費の視点から、投入した職員の人工費(労働時間)や経費の支出状況などのインプットと、施策の出来高(アウトプット)を、時間軸で逐次把握することで、金額をベースに施策の進捗状況を把握することができます。(進捗管理)  これにより、施策が適切に執行され進捗しているか、職員や経費の不足などが発生していないか、出来高に対して労力や費用が予定を超過していないか(成果に対して過剰に投入されていないか)、プロジェクトの課題を事前に察知し、問題の拡大前に対策をとることができます。これをプロジェクト会計と言います。  業績評価は、各種指標による施策の目的に対する結果の評価です。その評価には、次のようないくつかの視点があります。例えば、就業支援施策を例にして各視点を見てみると、 @インプット(投入量)  職員や経費など施策に投入した労力や資金。 Aアウトプット(出来高)  訓練の実施数や相談件数など、施策の出来高を測る量。 Bアウトカム(成果)  再就職者数とその収入など、施策によって生み出された成果(施策の目的に至るための必要条件量)。 Cインパクト(効果)  市民の所得増や貧困の減少など、施策の最終的な目的に対する達成量、達成度。 Dパフォーマンス(効率)  アウトプット、アウトカム、インパクトに対するインプットの割合。費用対効果が高いほど、限られた資源(職員、予算)における効率的な施策と考えられる。  このように、「評価」と言っても、施策の段階によって、その目的は異なり、適切な指標を使い分けることが必要です。(表1)  また、施策決定と結果の評価を短いサイクルで実施することで、施策を早期に修正し、職員や資金などの最適な配分を行う方法もあります。ニューヨーク市警は最新の犯罪発生状況を毎週地図にプロットして、戦略会議で警戒地域や取締り方法の重点化・最適化を図ることで、犯罪の発生を大幅に削減することができました。こうした地理情報システム(GIS:Geographic InformationSystem)やグラフによるデータの可視化は、意思決定だけでなく、市民との対話やコンセンサスの形成にも効果的と考えられます。 (2)内部管理業務におけるデータ活用  自治体の内部管理業務、いわゆる事務処理の執行管理においても、データの活用は有効な手段となります。  例えば、業務で扱う案件や申請など、一件ずつ処理単位ごとにシステムに登録して、管理することで、システムによるチェックが可能となり、処理の停滞や請求漏れ、未払いなどの処理漏れを防ぎ、執行管理の精度とリアルタイム性を高めることができます。コンプライアンスや内部統制の観点からも、データによる執行管理は、自治体にとって必要なものとなるでしょう。 4 これからのデータマネジメントの姿  行政におけるデータの発生から活用、市民や企業との共有に至るまでの、データの流れと関連項目を整理すると、図3のようになります。  まず手続き・申請などの処理や機器による計測などによりデータが生成され、各業務システムなどで蓄積、管理されます。それらは各業務の管理に活用され、また統計処理を施して市ホームページなどで公表・共有されていきます。また、ビッグデータ解析やAI等の活用など、庁内における施策立案へのデータ活用が期待されます。  このようにデータの流れがスムーズで要素の関連性が強固なまま、さまざまな場面で多様なデータ活用を実現するためには、解決すべき課題があります。 (1)データ項目およびコードの統一の必要性  多くの自治体では、それぞれの業務の内容や扱うデータの項目が全庁的に把握されておらず、全体でどれだけの業務の種類が存在し、どういったデータがあるのかが管理されていません。これでは、担当部署以外にデータの存在自体が知られず、企業・市民におけるデータ活用や、部署をまたがった集計・分析は不可能です。データの流れを見ても、まず、データの発生源である業務の種別、そこで扱われるデータ項目の種別を明らかにし、分類することがデータ管理の前提となることが理解できます。業務やデータ項目の一覧が全庁的に把握されていない自治体では、まず初めに業務の棚卸し、データ項目の棚卸しが必要となります。  さらに、データの管理や、複数のデータを組み合わせて活用するには、業務やデータの内容を識別する識別子(コード)の割り当てが必要です。担当部署ごとでデータ管理している自治体では、まずデータはもちろん業務にもコードが割り当てられておらず、名称や通称で管理されるので、名称が曖昧だと同じ業務か別の業務か識別ができないことがあります。また、同じデータ項目でも業務により表記が違ったり(例えば、子、こども、小児など)、同一のデータでも業務によってコードがバラバラだったり(例えば同一の施設でも、コードが違ったり)します。  このため、担当部署をまたがって業務を識別し、データを集計したり名寄せしたりするのに非常に多くの労力がかかり、データ活用の大きな障壁となっており、コードの割り当てとコード体系の統一はデータ活用に不可欠です。  自治体において全庁的に統一が必要なコードは、業務コード(事業コード)、共通語彙(項目コード)、データセットコード、ドキュメント(ファイル)コードなど数多くあります。 (2)データ項目・コードの統制とデータ管理体制の必要性  全庁的なデータ項目、コード体系を統一した後は、それを全庁に周知して普及させ、維持することが重要です。このため、常に新しいデータ項目の発生を監視し、必要なコード体系は整備し、独自のコード体系を作らないよう統制(コントロール)が必要になります。また、セキュリティの確保や担当部署を越えた円滑なデータ連携のためには、データの記録・保管や集計・検索、公開など、データの発生から利用までのライフサイクルにおいて、全庁的なデータ管理が必要です。  企業では社内のデータ管理が経営上重要なことから、データ管理を統制する「最高データ責任者」(CDO=Chief Data Officer)を採用し、社内横断的なデータ管理部門を設置しています。今後、全庁的なデータ管理に向けて、CDOやデータ管理部門を設ける自治体も考えられます。新たなデータ管理体制では、システム管理、統計集計、文書管理、情報公開、個人情報保護、内部統制などデータに関連する業務部門が関わることになると思われます。 (3)ICT技術のさらなる導入の必要性  自治体における業務システムの普及とともに、集計や分析に使えるデータの量は飛躍的に増大してきました。しかし、データは各システムに分散しており、他の部署や民間が活用するためには、改めて出力、集計、加工しなければなりません。データ活用のためには、それら異なるシステムに存在するデータを、効率よく集め、集計し、分析する仕組みが必要です。  データウェアハウス(DWH:Data WareHouse) は、いくつかの異なるシステムから必要なデータを収集して蓄積する統合データベースです。各システムから分離することで、各システム自体のデータに影響することなく、データ活用のための加工や集計、検索、出力がしやすくなっています。さらに、分析、グラフ化などを行うビジネスインテリジェンス(BI:Business Intelligence) ツールを使い、施策評価などの経営判断を行うことができます。  RPA(Robotic ProcessAutomation) は、パソコン上で動くロボットソフトによる業務の自動化です。これにより、これまで職員が手作業で行っていた、データの登録・更新作業や、集計作業を自動化することができ、データに関わる業務の効率化ができます。  近い将来には、自治体のデータを扱う業務にも人工知能( A I:ArtificialIntelligence) を導入することで、人が行うよりも高いレベルのデータ活用が可能となるでしょう。例えば、大量のデータ分析から、将来、生活習慣病になる可能性の高い人、貧困など生活上の困難に直面する可能性の高い世帯などを予測し、事前に必要な手当てや支援を行うことが可能となるでしょう。 5 まとめ:自治体におけるデータマネジメントの未来  オープンデータによる自治体からの情報提供は、IoTやAIの先端技術、データサイエンティストや多様なステークホルダーとともに、今後大きく広がるデータ空間を担い、企業・市民におけるデータを活用した新たなビジネス・サービスを創出する可能性を持っています。  自治体内においてもデータ活用により、より効果的な施策の立案・実施・評価が可能となります。そのためには、EBPMや施策評価についての用語や概念について、職員が共通の認識を持ち、共通の目標に沿って行動することが必要です。  また、データによって、施策の進捗管理、執行管理を行うことで、執行時の課題の早期発見と対応、処理漏れなどの事故を減少させ、業務の質を高め、内部統制を強化することができます。これらを実現するためには、データ項目およびコードの整備が不可欠であり、その統制の継続と、DWHを始めとするICT技術の導入も必要です。  今後は、自治体においてもCDOを頂点とする新たなデータ管理の組織体制が必要とされるのではないでしょうか。