Blog

ブログ

データマネジメント

名寄せとデータクレンジング①~「名寄せ」という言葉から連想するもの

「名寄せ」という言葉が世間で使われるようになったのは2005年の銀行のペイオフ解禁の際のことでしょうか。1金融機関あたりの1預金者の元本保護額が1千万円となったため、銀行は預金者を一元化しておく必要があり、その作業が「名寄せ」という言葉で報じられました。その後、年金問題の際にもニュース等でこの言葉を耳にした記憶のある方も多いでしょう。その頃には既に金融機関以外の企業でも大量の顧客情報を電子データで抱えるようになっており、「名寄せ」という言葉はかなり一般化しました。

「名寄せ」という言葉の字面から連想するに、名前を寄せる、すなわち重複する個人データを一つにまとめるようなことがイメージできるでしょうか。具体的には同じとみなとされる情報(個人・世帯・企業など)に同一のIDを振るなどの処理を施す訳ですが、そうしたデータを一つにまとめる作業はデータベースとして統合(すなわち一元化)されることにつながって行きます。
しかし、データの統合と言っても、その目的はデータ管理の数だけあり、一括りには説明できません。企業によっても部署・案件によってもデータの成り立ちは違います。何をもって一元化とするかはデータ収集・管理の目的によって違ってきますし、すべてのデータが統合下に置かれなければならない訳でもありません。

という漠然とした説明ではピンとこないかもしれません。そもそも大量の個人(もしくは法人)データの管理というものが我がことのようには感じにくい、というのもあるでしょう。しかし私たちは社会生活において様々な企業や団体に個人情報を登録しています。各法人が適正な管理を行っているという前提でですが、それらに情報を登録しているおかげで利便性の高いサービスを受けることができる仕組みになっています。その情報は最近スマホで登録したものもあれば、大昔に紙に書いて提出したものもあるでしょう。そうした時間差を超えてフラットにサービスが受けられるのは、何らかのデータ統合がなされていると考えて間違いありません。そしてそのために「名寄せ」を含んだデータ整備が最低でも一度は施されているはずです。

譬えがちょっと大きくなってしまいましたが、次回以降、なるべく具体性のある例をあげて「名寄せ」について、ひいてはそのために必要なデータクレンジングの話を進めて行きたいと思います。

つづく