株式会社エニイTOP > 製品一覧 > Name-Catch

Name-Catch

Name-Catchは、当社が長年培ってきた名寄せ業務のノウハウを活かして作られた重複データ検出プログラムです。名寄せ作業は勿論のこと、データクレンジングの初期作業などにも有効です。

Name-Catchの主な機能と特長

・CSVテキストファイルで(バッチ)処理。
・重複データにグループ番号を付与して出力。
・項目の選択・組み合わせ条件が自由に。
・名寄せ用に事前整備(表記統一など)したデータも出力可(別途データを精査したい場合等に使用)。
・住所処理(バーコードデータ化)は直接Address-Catch(住所整備プログラム)を呼び出すことが可能。

組み合わせ自由な重複検出条件

重複検出条件は3項目・2項目・1項目の一致でそれぞれ処理が可能です。
■3項目一致
・[氏名] + [住所] + [電話番号]
■2項目一致
・[氏名] + [住所]
・[氏名] + [電話番号]
・[住所] + [電話番号]
■1項目一致
・[住所]
・[電話番号]

設定できる項目の条件
項目名 設定条件
氏名 姓・名1つになっている場合、姓・名2つに別れている場合、それぞれ指定できます。(姓名分割の機能はありません)
住所1 住所は最大3分割で指定できます。これらに指定された項目に対してAddress-Catchを直接呼び出してカスタマーバーコードデータを取得します。既にバーコードデータを取得済みの場合は、住所項目指定は行わず、「カスタマーバーコード」項目を指定します。
住所2
住所3
カスタマバーコード 事前にカスタマバーコードが取得されている場合は、この項目を指定します。
電話番号 携帯電話・IP電話の番号が混在していてもデータしては受け付けます。
OPT1 上記以外の情報を材料に使用したい場合(ステータスで状況を示す)
OPT2

※カスタマバーコードとは、郵便事業等で処理を効率化するために宛先住所を「郵便番号+住所表示番号」によってバーコードデータ化させたものです。

Name-Catchの事前処理について

各項目の事前処理内容一覧
全半角統一 ひらがな・カタカナ統一 大文字小文字統一空白除去 異体字統一 記号除去 特殊カナ変換 商号除去 数字のみ
氏名
住所
カスタマバーコード
電話番号
OPT1,OPT2

・異体字統一・・・「斉」「斎」「齋」「齊」といった異体字を統一します。(約800種類)
・記号除去 ・・・以下の記号を除去します(全半角共通)。
  ! “ # $ % & ‘ ( ) * + . / : ; < = > ? [ \ ] ^ _ ` { | } ~ 。 、 ・ \ 〈 〉《 》「 」『 』【 】
・特殊カナ変換・・・「ャ」「ュ」「ョ」等を「ヤ」「ユ」「ヨ」に変換します。「アー」「トー」等を「アア」「トオ」に変換します。また、濁音・半濁音についても除去します。
・商号除去・・・「株式会社」「財団法人」などの法人格を除去します。また、カッコで囲まれた「(株)(有)(財)」、を除去します。
・数字のみ・・・数字以外のデータを全て除去します。
※住所はAddress-Catchの処理仕様です。カスタマバーコードについてはそのまま処理します。
※OPT1,OPT2についてはそのまま処理します。

出力ファイルについて

Name-Catchは、入力ファイルに対して、2ファイル出力します。
・重複検出ファイル・・・重複データにグループ番号を付与したファイル。
・名寄せ用整備データ・・・ Name-Catchで内部的に事前処理した重複検出用の統一変換データを出力します。別途DBでデータを個別精査したい場合に使用します (あくまでも整備用データであってクレンジングデータではありません)。処理条件は上記「各項目の事前処理内容一覧」参照。住所に関しては Address-Catchを呼び出して、カスタマバーコードと住所レベルのステータスを出力します。

入力データ例

ID,氏名,住所,電話番号,区分,登録日
1,斉藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,A,20140101
2,斎藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,A,20140101
3,齊藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,B,20140101
4,齋藤一郎,東京都中央区日本橋人形町1-1-1,03-1111-1111,A,20150101
5,斉藤一子,東京都中央区日本橋人形町1-1-1,03-1111-1111,C,20141111
6,鈴木二郎,東京都中央区日本橋人形町2-2-2,03-2222-2222,A,20120202
7,鈴木二郎,東京都中央区日本橋人形町2-2-2,03-2222-2222,B,20120212
8,鈴木二郎,東京都中央区日本橋人形町2-2-2,03-2222-2222,C,20120222
9,鈴木三郎,東京都中央区日本橋人形町3-3-3,03-3333-3333,A,20130303

出力データ例(重複検出ファイル(3点項目一致で設定))
出力データ(重複検出ファイル)
出力データ例(名寄せ用整備データ)
出力データ(重複検出ファイル)

動作環境

システム(OS):Windows Vista/7/8、Server2003/2008が動作する環境のAT互換機
HDD:300~400MB程度の空き容量(変換データの空き容量は含めない)
言語環境:富士通 NetCOBOL Base Edition 運用パッケージ(※)
      :富士通 PowerSORT
※富士通 NetCOBOL運用パッケージはAddress-Catchの動作にも必要な環境です(共用できます)。

お問合せ・資料請求

お問合せ・資料請求については、下記お問合せ窓口までお気軽にご連絡下さい。

SSL対応お問合せフォーム

お問合せ窓口
お問合せ窓口
お問合せ窓口