Blog

ブログ

データマネジメント

住所データクレンジングのメリットと目的

前回は住所のコード化について書きましたが、コード化自体は手段に過ぎません。少しイメージしやすくなってきたかとは思いますが、住所データクレンジングの目的はその先にあります。今回はそのメリットを改めて洗い出してみたいと思います。
まず、住所情報が文字列のままで不便なこととはなんでしょうか。

<不便な点>
①ソートをかけても期待した並びにならない。
②同じ住所(世帯)の抽出が容易ではない。
③旧住所の検出と修正が難しい。
④間違った住所情報の判別と修正が難しい。

まず①については市町村コードと郵便番号とでざっと対応可能で、カスタマバーコードがあればなおよしです。②についてはカスタマバーコードと市町村コードを併用すればある程度の精度が期待できます。③と④は有償の住所マスタが必要となりますがマスタとの照合で対応・維持が概ね可能です。
不便な点の解消で更に次の展開(その先の目的)が見えてきます。

<不便を解消した上での展望>
①エリアマーケティングへの活用。
②データの名寄せ。
③旧住所の自動変換体制。
④送付物の不着等による損失の軽減。

体系的なコードと結び付けることは①への展開につながります。コードを正確な識別子として利用することで②の効率化が図れます。③については新旧の対応関係がリンクされている住所マスタと照合することで実現できます。④については誤った住所情報を検出することによって配達物の不着を未然に防ぐことができ、その上で起きる不着という結果に対しては別の対応方法に絞ることが可能となります。
こうした展望が期待できる住所データのクレンジングですが、これらすべてに大きなメリットが見出せる場合もあれば、①~④の中の一つか二つの不便が解消できればいい、という場合もあるでしょう。(ごく当たり前の結論ですが)こうした目的が明確になれば、データクレンジングにどこまでコストをかけられるかが自ずと見えてくるはずです。
ところで、これらのクレンジングを目視で一つ一つ手作業していくのは現実的ではありません。プログラムで対応させることになるのですが、ここから先は我々専門家にお任せいただくことになります。
つづく