Blog

活動ブログ

  1. HOME
  2. ブログ
  3. イベントレポート
  4. DX・スマートシティ時代に 正しく理解しておきたいデータの基礎知識

DX・スマートシティ時代に 正しく理解しておきたいデータの基礎知識

開催概要はこちらをご覧ください。

オープンデータ


講師:内閣官房オープンデータ伝道師、Code for Saga代表 牛島 清豪 氏
概要:オープンデータの定義、DXやスマートシティで活用するためのオープンデータ、など
※画像クリックで講演資料(PDF)をダウンロードできます。

ビッグデータ


講師:株式会社ナイトレイ データコンサルティング部 松田 一朗 氏
概要:ビッグデータの定義と種類、蓄積されたデータが持つオープンデータとは異なる価値、など
※画像クリックで講演資料(PDF)をダウンロードできます。

パーソナルデータ


講師:JIPDEC主任研究員 郡司 哲也 氏
概要:パーソナルデータと個人情報の違い、など
※画像クリックで講演資料(PDF)をダウンロードできます。

パネルディスカッション

モデレーター

パネラー

ちょっとだけDXのお話




佐藤:最近「DX(デジタル・トランスフォーメーション)」という言葉をよく目や耳にします。
これは「デジタル技術を浸透させることで人々の生活をより良いものにしていこう」とか「既存の価値観や枠組みを根底から覆すような革新的なイノベーション」などと定義されているものですが、DXは業務フローの一部分だけにツールを導入するという単純な業務改善・業務効率化ではなく、全体の最適化を図っていくものになります。
そんなDXに必要な要素として「データ」があります。個別の仕組みがデジタル化していくと、いろんなデータが連携されることで全体最適へ持っていくことができるからです。つまり、DXを達成するための条件として、データは重要な基礎となるわけで、そこを押さえていかないといけません。

前半のレクチャーで寄せられたコメント

アバカーンってどういう意味ですか?

牛島:アバカーンというのは佐賀の方言で「入りきらない」という意味です。これから缶のなかにデータが増えていくと缶のなかに入りきらなくなる、それをオープンにしていこうという意味を込めています。

OpenGRAMは滋賀でもやっているのですか?

藤澤:地域の写真などといったコンテンツをアーカイブするような行政の事業はいくつもありますが、OpenGRAMとして公開しているかは分かりません。
牛島:OpenGRAMは最近図書館が取組みを始めています。大阪市立図書館さんはワークショップをやったりもして、すごく進んでいるなと思います。

データと現場をつなぐ人を育てるにはどうしたらいいですか?

松田:まず現場を知っている人から育てることが重要と思います。会社がいきなり外部のデータサイエンティストさんを呼んできて、会社の業務をわかっていますかと言っても難しいでしょうから。まず現場から「どういうデータがあるのか」「そのデータから得られることは何なのか」を伝えてくれる人を育てることが重要だと思っています。

佐藤:特に行政機関だと、目的が曖昧なままとりあえず人材を投入するケースが往々にしてありそうだと感じます。もし組織の中に入れられたら入れられたで、動き切るチームにしないと勿体ないと思うのですが、どう声をあげていくべきなのでしょうね。

松田:行政って3年タスクで異動するので、データの考え方を定着させることは難しいと思うのですね。なので、業務の一環として習慣化してしまうよう落とし込んだ方がいいのかなと。特に行政はそういう習慣から仕組みづくりをした方が良いと思います。

データについて誤解されがちなこと -現場との認識の乖離-

佐藤:それぞれの立場で感じている現場との認識の乖離についてうかがえますか?

牛島:「データ」と聞いたとき、Excelシートにズラズラ並んでいる数字や、プログラムの書かれたテキストを想像してしまう人が多いと思います。そこにアレルギーを感じるのは、気持ちとしてよくわかるのですよね。でもデータは本来身近なもので、例えば買い物をしたときのレシートもデータなわけです。そういう身近なものであることを共通理解にしていくことも重要かなと思います。
あと、ビジュアライゼーション、BIツールやGISなど「見える化する技術」も今は簡単に使えるのですが、ビジネスの現場でも意外と知らない人は多いと思うのですよね。自治体の方に「Googleマイマップならこのデータを10分で可視化できますよ」みたいなことを話すと、「おおー」と言われます。「難しいこと考えず、身近なことから取り組めばいいんだよ」ときちんと伝えていくことが重要かなと思います。

佐藤:オープンデータとして公開しちゃいけないものを誤解して公開するケースってあるのでしょうか。
牛島:佐賀県内の交通事故情報をオープンデータとして公開してもらい、分析をすることで事故を減らせないかという取組みをしたことがありました。(匿名化により)都市部では誰の事故かわからないものの、田舎のほうに行くと「この交差点で何月何日に事故を起こした人って◯◯さんじゃないか」と、個人を特定できてしまうケースがあるのですよね。知らない人が見ればオープンにして問題ないのだけれど、特定の人が見ればパーソナルデータに近い情報が含まれるという、難しいケースに直面したことがあります。
佐藤:人口の少ない地域に行けばいくほどそういうケースに陥ることがあるわけですね。

松田:観光分野でも、各都道府県市区町村が出している観光動態調査みたいなものがありますが、そこで使われているデータが自治体によってバラバラだったりします。集め方や調査項目、酷い場合だと年度区切りか年区切りかという集計単位すらもバラバラで、データの標準化が図られていないことがあります。いざデータを使いたいとなった際のネックになりがちで、どうしたらよいのかモヤっとすることがあります。

松田:ビッグデータの分野では「分析すれば施策が見えてくる」と誤解している人が多いなと思います。データ分析とマーケティングは全く別物で、データ分析をしたから観光客が100万人訪れる施策を打てるなんて甘い話はありません。データ分析とは何かを注意して伝えないといけないと自戒しています。
佐藤:AIについても、「これを使えばなんでもできる」と魔法みたいに捉えられていますよね。そのような誤解を解いていくためにはどうしたらいいのでしょうか。
松田:実際にデータを使っていただくのも重要ですが、施策に落とし込むためのフローを体系化することが重要かなと思います。「この事例では、このデータ分析をしてこのフレームワークに当てはめた結果、こういう施策にします」という一連の流れがすっ飛ばされてデータ活用の議論が行われるから、誤解されるのでしょうね。

郡司:パーソナルデータには「同意の原則」というものがあります。先ほど「パーソナルデータは本人が嫌な思いをしなければ大丈夫ですよ」みたいなことを言いましたが、本人にデータを使う目的をきちんと伝えて、その目的の範囲内で使うのであればOKなのです。
ですから「(学校などの)緊急連絡網が使えなくなった」というエピソードは大きな誤解の一つです。緊急時の電話連絡を目的に情報を集めて関係者に配る、それで皆さんOKを出しているのに、個人情報に関する誤解があるために緊急連絡網が配られなくなっちゃう、悲しいケースなのかなと思います。
自分が便利になるのなら人は個人情報を提供してもよいと感じるものだと思っています。例えば、Amazonとか楽天などでモノを買うと「この手のやつ検索していましたよね」と、さっき買った商品の広告がバンバンでてきて不快に感じたりすることがありますよね。あれって「私の購買履歴を使ってもいいですよ」「買ったものは表示しないでね」と個人がコントロールできるようになれば、広告を流す側は既に購入された商品の広告ではなく「もっといいのがありますよ」という広告に替えられるかもしれないと思うわけです。iOS14からアプリ間のデータトラッキングについて許諾画面が出るようになりましたが、本人に「これやってもいいですか」と問いかけをして「いいですよ」と返してくれた人にはそれに応じたサービスを提供する、というビジネスはこれから一般化するのではと思います。

佐藤:(YouTubeからの)コメントには、サードパーティ系のデータに関する意見も寄せられています。私の会社が持つデータは、気象庁からデータを買って、それを弊社で加工して販売しています。そういうルールのもと提供しているわけですが、サードパーティのものを買ってオープンにするというのは論外だと思うのですよね。

牛島:データをビジネスに使っている人は、ちゃんとその辺は確認していると思うので、ある程度制御できているとは思いますが、個人は危ないと感じるケースが多いですね。個人ってコピペの文化で、コピー元のライセンスを確認する人っていないと思うので。テレビの画面をスマホのカメラで撮って、ツイッターにあげたりする人って、偉い人も含めて多く見かけますが、それやめた方がいいですよね。

郡司:アンケートをとり、その集計から納品までを外の会社に委託することってあると思うのですが、その際の委託先に対する個人情報取扱への注意、「ちゃんと消去していますよね」などと確認するのは重要なポイントです。
そういうリテラシーを底上げすることが重要なのかなと思います。音楽や映画とかって今ではストリーミングで見られますが、媒体でCDやDVDとして買ったりすると「自分でお金を払って買ったものだから、自分がどうしようが勝手じゃん」みたいに思っている人もいまだに居るから、不法アップロードとかが後を絶たないわけじゃないですか。それってあなたが個人の楽しみのために対価を払っているのですよという、日本人にはまだそういうリテラシーが根付いていないとは感じますね。

琵琶湖の環境保全のための想いを繋ぐ -びわぽいんとの紹介-

佐藤:ここで、せっかく滋賀の話なので、琵琶湖に関する取組みをNPO法人琵琶故知新の藤澤さんから紹介していただこうと思います。





藤澤:「びわぽいんと」とは利他・共感・持続で、琵琶湖を守るための仕組みです。琵琶湖の課題に取り組む活動をポイントで見える化し、循環させようと前琵琶湖汽船社長の川戸さんが提唱したポイントサービスです。
滋賀県はNPO活動が盛んな地域と言われています。環境保全活動に取り組む団体に企業が共感して支援していこうという動きがあるなかで、それを原資に当てていきます。琵琶湖の清掃活動に参加した市民にポイントを付与し、付与されたポイントを地域のお店で使えるようになったり、あるいは新たな活動に寄付できたりできます。びわぽいんとの特徴は単に消費するのではなくて、新しい活動にまわしていく、消費されないポイントという点が最大の特徴です。
スポンサーであるとか琵琶湖知新であるとか市民、活動団体、地域のお店が絡むなかでポイントが動いていきますので、その循環のなかで様々なデータが生まれていきます。このデータを活用して地域課題解決につなげていく仕組みを考えています。

びわぽいんと×「データ」の視点 -びわぽいんとで考慮すべき点ってなんだろう?-

佐藤:これからびわぽいんとを本格化させていこうとするなかで、データの観点で不足している部分もありそうな気もしまして。びわぽいんとの事例に対して、データの観点でどこに注意をした方がいいのか少し伺いたいと思っています。

牛島:データの組み合わせ、びわぽいんとで蓄積されたデータと行政のデータを組み合わせて新しい知見を発見するのは一つの見方としてあると思います。それと、ポイントって個人に紐づくのでパーソナルデータに近い概念かもしれませんが、パーソナルデータも非識別加工をして分析できるデータとして扱うことで、マーケティングに有効な分析ができることもあると思うのですよね。例えばひとつの事例としてあるのが全国学力テストで、あれは個人に紐づく学力診断なので、そのままオープンデータにできませんが、非識別加工をかけて分析できる形にすることで、このエリアの子どもたちにはこういう特性があるので、この教材を与えたほうが学力を伸ばせる可能性が高いとか、分析ができる可能性もあるわけですよね。「パーソナルなので必ず閉じなくてはならない」ではなく、開くことで次の何か取組みに繋げていくことを考えてみるといいのかなと思いました。
松田:一つは蓄積するカラムをどうするかということ。一番分かりやすいのは住所で、例えば滋賀県守山市◯◯町という住所があったときに、それを一つのカラムにするのか「滋賀県」「守山市」「◯◯町」と3つのカラムにするのかとかで、活用できる範囲が変わってくると思うのです。それぞれ良し悪しがあると思うので、何に使いたいのか整理して考える必要があると思います。
もう一つは秘匿処理で、行動ログとかGPSの解析をやっていると、GPSのログって24時間蓄積されているものなので、その人の家の位置がわかっちゃうのですよね。つまりどこに住んでいるかということも全部わかってしまうのですが、そのデータをそのまま渡したら問題なので、我々もちゃんと加工して渡しています。購入データや行動ログも同じだと思うので、どういう情報はクレンジングで排除すべきなのかという点も配慮すべきだなと思います。
郡司:アプローチがふた通りあると思っていて、個人に還元するのか全体に還元するのかという話。ポイントが貯まると嬉しいからみんなポイントを貯めようとするじゃないですか。そうするといっぱい情報をくれた人にはいっぱいポイントをバックしますという仕組みなのか、やっぱり位置情報にしても購買情報にしてもパーソナルデータは秘匿化とか匿名化とか仮名化という処理をしないと難しいので、個人に還元するのであれば、予め個人に「こういう情報をくれるとこう使って、だからあなたにはポイントがいっぱい入ります」というような、本人が納得できる説明をいかに分かりやすくするかがいちばん重要かなと思います。あまり匿名化とか統計化とかしすぎると、パーソナルデータの価値って下がっちゃう気がするのですよね。だったらはじめから正直に「こう使います」と言って、その通りに使うことが正しい気がします。

佐藤:今後「びわぽいんと」の構想を進めるに当たり「個人情報の取扱いなど、プロに意見聞かないと不安やなあ」となったときはどうしたらいいでしょう。
郡司:シンプルで、利用目的を明確にするのが第一だと思います。一度集めたパーソナルデータの利用目的を超える利用をしたくなったら同意を取り直すしかないですね。知らない間に別のことに使われていたというのが一番心象悪いですし、信用されなくなったらアウトなので。
新しいサービスを開始するときは「この間もらったデータはこういう目的でも使うのですが、継続してサービスを使いますか」と通知をして同意をもらう手続きは避けて通れないのかなと思いますね。

佐藤:今日は3種類のデータについてお話をいただきましたが、それぞれ密接に関わっていますし、それぞれの特性を知った上できちんと了解等を得て活用していくことが大事なのかなと思いました。お話いただいた御三方、ありがとうございました。

関連記事

月を選択