名寄せは顧客・案件ごとに定義も条件も違ってきます。そしてその定義・条件に合わないデータの処理全てを既存のプログラムで対応することは困難です。しかし、一定レベルまでプログラムで事前処理することによってバラつきを減らし、共有可能なレベルで名寄せ対象候補を作成することは可能です。
Name-Catchはそうした名寄せ・データ統合のソリューションをスムーズに進めるための事前処理を行う重複データ検出プログラムです。長年培ってきたデータクレンジング処理のノウハウがここに詰まっています。テキストファイルでのバッチ処理となるため、データベースの仕様は問いません。住所は「Address-Catch」を利用するため高精度の判定が可能です。
重複検出条件は3項目・2項目・1項目の一致でそれぞれ処理が可能です。
■3項目一致
・[氏名] + [住所] + [電話番号]
■2項目一致
・[氏名] + [住所]
・[氏名] + [電話番号]
・[住所] + [電話番号]
■1項目一致
・[住所]
・[電話番号]
項目名 | 設定条件 |
---|---|
氏名 | 姓・名1つになっている場合、姓・名2つに別れている場合、それぞれ指定できます。(姓名分割の機能はありません) |
住所1 | 住所は最大3分割で指定できます。これらに指定された項目に対してAddress-Catchを直接呼び出してカスタマーバーコードデータを取得します。既にバーコードデータを取得済みの場合は、住所項目指定は行わず、「カスタマーバーコード」項目を指定します。 |
住所2 | |
住所3 | |
カスタマバーコード | 事前にカスタマバーコードが取得されている場合は、この項目を指定します。 |
電話番号 | 携帯電話・IP電話の番号が混在していてもデータしては受け付けます。 | OPT1 | 上記以外の情報を材料に使用したい場合(ステータスで状況を示す) | OPT2 |
※カスタマバーコードとは、郵便事業等で処理を効率化するために宛先住所を「郵便番号+住所表示番号」によってバーコードデータ化させたものです。
Name-Catchは、入力ファイルに対して、2ファイル出力します。
・重複検出ファイル・・・重複データにグループ番号を付与したファイル。
・名寄せ用整備データ・・・ Name-Catchで内部的に事前処理した重複検出用の統一変換データを出力します。
ID,氏名,住所,電話番号,区分,登録日
1,斉藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,A,20140101
2,斎藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,A,20140101
3,齊藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,B,20140101
4,齋藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,A,20150101
5,斉藤一子,東京都中央区日本橋人形町1-1-1,03-1111-1111,C,20141111
6,鈴木二郎,東京都中央区日本橋人形町2-2-2,03-2222-2222,A,20120202
7,鈴木二郎,東京都中央区日本橋人形町2-2-2,03-2222-2222,B,20120212
8,鈴木二郎,東京都中央区日本橋人形町2-2-2,03-2222-2222,C,20120222
9,鈴木三郎,東京都中央区日本橋人形町3-3-3,03-3333-3333,A,20130303
システム(OS):Windows 7/8/10、Server2008/2012が動作する環境
HDD:1GB程度の空き容量(変換データの空き容量は含めない)
言語環境:富士通 NetCOBOL Base Edition 運用パッケージ(※)
:富士通 PowerSORT
※富士通 NetCOBOL運用パッケージはAddress-Catchの動作にも必要な環境です(共用できます)。
サービスについてのご相談やご依頼、また見積もりのご依頼などございましたら、お気軽にお問い合わせください。
株式会社エニイ
TEL. 03-3356-6690
受付時間 平日10:00~19:00(土日祝 定休)