というわけで、南大阪企業データベースの更新作業をはじめたところ。
NTT 職業別電話帳(タウンページ)のデータを購入すれば簡単なんだけど、なにしろ高額で、南大阪全域総額で120万円超になる。堺市分のみ昨年度予算で購入したが(45万円ほど)、プロジェクトの今年度予算が思いのほかに削られていたので、その他の地域については購入不可能となった。そこで・・・
とりあえずネットで見つけた別の会社から、大阪府下の企業リストファイルを購入した(数万円)。このリストから重複分を削除する処理などを施したところ、堺市を含む南大阪全域で 54620 社を抽出できた。しかし、問題はデータの信憑性(正確性)。そこで・・・この 54620 社のうち 堺市の分 18624 社を、既に購入済みの NTT タウンページのレコードと照合してみたところ、18624 社中 15834 社は NTT タウンページにも掲載されており、この 15834 社中、電話番号・郵便番号・住所がタウンページと完全に一致するのは 10609 社だった。つまり、18624 社中、2790社(15%)はタウンページには掲載されておらず、5225 社(28%)についてはタウンページに掲載されているものの住所が異っている。が、しかし試しに・・・と思いついて、タウンページに掲載されていないか、掲載されていても住所が異なるものをいくつかランダムに選んで、Google Map で確認してみたところ・・・驚くことに、それらはGoogle Map には掲載されており、住所も一致する。つまり・・・
私の勝手な憶測だが、Google Map 掲載の会社名や住所は、この会社のリストとおなじソースを使っているのではないだろうか(あるいは、この会社が Google Map からデータを拾ったのか)。すると、Google Map に掲載されている企業や店のうち、15%は NTTタウンページには掲載されておらず、28%は掲載されていても住所がタウンページのものとは異なる可能性があるのではないか(繰り返しますが、これは私の憶測です*1)。
もちろん、タウンページと Google Map のどちらが正しいのかはよくわからない。が、次回のわれわれの景況調査では、後者に近いと思われる住所録にもとづいて 1000通を発送する。不達で戻ってきたものを詳しく調べてみたい。