2015年1月16日金曜日

3次元空間での科学データとソーシャルデータの融合

Google Earthは、様々な地球環境情報を3次元空間に表示できる。例えば、図1~図3は大阪大学に設置されたNICT(情報通信研究機構)の気象レーダが観測した大阪平野の降雨分布である。時々刻々変化する大阪平野の局所的豪雨の状況を3次元的に表示している。一般の雨は例えば大阪平野を覆うように広く降るが、近年、図1のように限られてたエリアで数㎞~数10㎞にわたり強く降る局所的豪雨(いわゆるゲリラ豪雨)が注目されている。

図1 大阪平野の局所的豪雨(真上から見た図) 

図2 大阪平野の局所的豪雨(斜め上から見た図)

図3 大阪平野の局所的豪雨(横から見た図)

このように、気象センサーや環境センサーの情報をリアルタイムに3次元空間上に可視化することは、個人が特定の位置(大阪平野の特定の場所)から見ていても理解することが難しい「空間情報」を把握するためには有効である。

ここで興味深いのは、気象レーダによる降雨観測は、あくまで「上空の雨」を観ているということである。一般には、気象レーダは数㎞以上の高度の降雨を観測する。言い換えると、「気象レーダで雨が降っているからと言って、必ずしも地上で雨が降っているとは限らない」わけだ。

そこで、地上の降雨を測定するのが雨量計である。雨量計としては、図4に示す気象庁のAMeDAS(アメダス)が有名であるが、実は高速道路や鉄道などにも設置されている。民間では、NTT DocomoがAMeDASとほぼ同じセンサーを国内に広く展開している。AMeDASは国内に1200点以上、NTT Docomoは4000点の雨量計を展開している。
図4 気象庁AMeDAS(アメダス)の配置図

国内に1000点以上配備されている気象庁の雨量計であるが、実はその数は十分ではない。図5は、図1~図3の気象レーダによる局所的豪雨とAMeDASの雨量計の配置を比較している。これを見ると、雨量計の数(配置)は局所的豪雨をとらえるには十分ではないことがわかる。実際、図7の2012年7月26日の例でも明らかである。気象レーダは、京都・宇治近郊の局所的豪雨(10㎞以下の空間スケール)をとらえているが、AMeDASで見るとこの日は「晴天(雨はほとんど降っていない)」のである。

図5 気象レーダによる局所的豪雨とAMeDAS雨量計配置(1)

図6 気象レーダによる局所的豪雨とAMeDAS雨量計配置(2)

図7 2012年7月26日のAMeDASデータと気象レーダデータ(大阪大学)

このように、各種のセンサー情報をデータベース化し、分析・可視化する技術はビッグデータ技術の中心の一つとして注目を集めているが、「データは必ずしも事実を反映しているわけではない」のである。LODを考える際、データの信頼性(言い換えるとデータの適用範囲)を十分に理解しないと、誤った解釈や判断につながることがある。

雨量計の個数は数千点であるが、一方で日本人の数は1億2千万人である。日本人が何らかのセンサーの役割を果たすと考えると、強力なセンサーとなることがわかる。いわゆるヒューマンセンサーという考え方である。近年、ビッグデータ処理において、このヒューマンセンサーを考える事例が多い。。ここでは、ソーシャル情報をヒューマン気象センサーとして、既存の気象センサーデータと融合して可視化することを提案する。

気象(降雨・豪雨)を扱うことができるヒューマンセンサーデータ(ソーシャル情報)として、Twitter情報を考える。Twitter情報には位置情報・時刻情報が含まれるため、センサー情報を3次元時系列空間で可視化した際に、同時に3次元時系列空間に併記することができる。ここでは、特定の日時で大阪平野またはその近郊において「雨」という文字列を含むつぶやきをした端末(多くはスマートフォン)の位置情報を、その時刻に従って3次元空間に可視化する。

可視化結果が図8~図11である。これらの図は、時々刻々変化する局所的豪雨の様子を示しているが、見事なまでにつぶやきの領域が気象レーダによる降雨領域の移動と一致している。

図8 局所的豪雨観測(気象レーダ)とその時刻の「雨」を含むTwitter発信位置(1)

図9 局所的豪雨観測(気象レーダ)とその時刻の「雨」を含むTwitter発信位置(2)

 図10 局所的豪雨観測(気象レーダ)とその時刻の「雨」を含むTwitter発信位置(3)

図11 局所的豪雨観測(気象レーダ)とその時刻の「雨」を含むTwitter発信位置(4)

もちろん、Twitter情報(ヒューマンセンサー情報)にはノイズが必ず含まれる。雨が降っていなくても「雨が降っている」と偽ることは容易である。また、「雨宮さん(人名)」や「雨見山(群馬県)」などの固有名詞が含まれることもある。しかし、上記の通り、ヒューマンセンサーの魅力はその数であり、ノイズ(SN比)を考慮しても有効に機能することがある。

気象データやTwitterデータの多くは、残念ながら現在はLOD公開されていない。しかし、これらの情報が広くLOD化されることにより、可視化技術と組み合わせることで「地域可視化」が進むであろう。LODの重要な目標は、「データの適用範囲」に配慮しつつも、制限なくできるだけ多くのデータがLODの形で公開されることである。


0 件のコメント:

コメントを投稿