捉え直される「アンデータ」:見えないデータが意思決定を変える

「アンデータ」という言葉は、一般にはあまり定義が固定されている概念ではありませんが、ここでは“データがない/データになっていない状態”や、“データとして扱われる前に失われたり、意図的に捨てられたりするもの”を含む広いテーマとして考えてみます。重要なのは、アンデータが単に情報の欠落ではなく、現実の理解や判断のしかたそのものに影響を与える「見えない前提」になり得る点です。つまり私たちは、データがある世界だけで意思決定しているのではなく、同時に「データにできなかったもの」や「データ化されなかったもの」によっても、思考の枠組みが形づくられている可能性があります。

まず、アンデータが生まれる代表的な経路を考えると、そこには技術的・制度的・文化的な壁が絡みます。技術的には、センサーや計測手段が届かない領域、あるいは計測コストが高すぎる領域が存在します。たとえば都市の交通データは整備されやすい一方で、人が体感する不安や安全の印象のように主観に依存するものは、そのままでは数値化しにくく、結果としてアンデータとして残りやすい。制度的には、プライバシー規制やデータ利用の制限によって、個人を識別しうる情報が回避され、集計の粒度が粗くなることがあります。さらに文化的には、そもそも「語られない」「記録されない」価値観や事象があり、たとえ存在していてもデータとして回収されにくい。こうした積み重ねによって、データ化される現実とされない現実の境界が生まれ、それが社会の“見え方”を決めていきます。

次に、アンデータが意思決定へ与える影響は、見落とされがちな形で現れます。例えばAIや統計モデルは、多くの場合「観測されたデータ」に強く依存して学習します。そのとき、アンデータはノイズのように見えることもあれば、単に無視されることもあります。しかし、無視された事象が実際には重大である場合、モデルが学習しているのは“現実の一部”であり、“現実全体の近似”ではありません。さらに厄介なのは、アンデータが偶然の欠測ではなく、意味を持った欠測であることです。たとえば、支援が必要でも申請しない人、声を上げられない人、記録のタイミングが合わない人などは、データ上は「いない」のに近い状態になります。すると、施策は「データに映る人」に最適化され、「データに映らない事情」を抱える人には届きにくくなります。こうして、アンデータは単なる欠落ではなく、結果の偏りを固定化する装置になり得るのです。

この問題を理解する鍵として、「データは現実を映すだけでなく、現実を切り取る」という視点が有効です。アンデータがあるということは、切り取られなかった部分が存在するということでもあります。切り取られなかった部分が何かを明確にしないまま、切り取られたデータだけを“現実そのもの”のように扱うと、世界の理解が段階的に歪んでいきます。たとえば、災害対応において、通報件数のようなデータは迅速に収集できても、通報できなかった人の事情や、通報手段がない地域の状況はアンデータになりやすい。すると、対応資源は通報が届く範囲に集中し、結果として次のサイクルでもアンデータは縮まらず、格差が再生産されます。ここには「データを集めた結果、現実が改善する」という単純な物語が成立しない構造が潜んでいます。

では、アンデータと向き合うにはどんな姿勢が必要でしょうか。第一に、アンデータを“欠落”として扱うだけでなく、「欠落が生まれる理由」を追跡することが重要です。データの生成過程、記録のルール、計測の範囲、利用可能性の条件を問い直すことで、「なぜ観測されないのか」が見えてきます。第二に、アンデータを推定したり代替指標を設けたりする発想も必要です。単に「ないものはない」と断言するのではなく、補助的な観測、質的な調査、周辺データの組み合わせなどによって、アンデータに関する不確実性を可視化する方向に進むべきです。第三に、評価指標やモデルの目的関数を再考する必要があります。つまり「当たること」だけでなく、「見えていない領域で何が起きているか」を含めて性能を測る設計が要請されます。

さらに、アンデータは“欠点”で終わらない可能性もあります。なぜなら、アンデータには価値判断の痕跡があるからです。何がデータ化され、何がされないのかは、技術だけでなく、社会がどんなものを重要だと考えてきたかの表れでもあります。アンデータを調べることは、裏側にある価値観や制度設計の方向性を読み解く作業になり得ます。たとえば、ある地域の生活実態が経済指標に現れにくいなら、その指標体系が前提にしている「望ましい生活像」そのものを問い直す必要が生まれます。アンデータは、データの不足を埋める課題であると同時に、データ化の基準を検討する契機にもなります。

このように「アンデータ」をテーマとして考えると、見えないデータが意思決定の枠組みを変えうることが分かってきます。アンデータは、単なる空白ではなく、データ化されない現実の存在を示し、その境界は私たちの社会や技術の設計に刻まれています。だからこそ、データがあることを前提にした議論から一歩踏み込み、「なぜ見えないのか」「その見えなさは誰にとって不利益なのか」「見えない領域をどう扱うべきか」を問う姿勢が求められます。アンデータは、情報社会の盲点を照らす鏡のような存在であり、そこに目を向けることが、より公正で現実に即した判断へ近づく第一歩になるかもしれません。

おすすめ