Погуглив вашу проблему, я нашел 2 интересные ссылки:
- https://github.com/EthanRBrown/rrad, который предоставляет около 3200 реальных анонимных адресов.
- https://openaddresses.io, у которого также есть ссылка на гитхаб с открытым исходным кодом с полным набором данных.
Я не рекомендую очищать генераторы поддельных адресов, так как они не гарантируют существование. Я бы тоже не стал делать выборку в картах Google, так как вы наверняка попадете в черный список.
Извлечь данные из загруженного zip-файла в 2 легко: это zip-файлы, содержащие CSV-файлы с полным адресом, zip, lat, lon и т. д.
Два приведенных выше набора данных «гарантируют» существование адреса. Я не знаю, насколько сложны ваши другие условия, а именно наличие хотя бы одного действительного адреса для каждого из 41 000 почтовых индексов. Если это жесткое ограничение, я сомневаюсь, что вы получите такой набор данных с открытым исходным кодом.
ИЗМЕНИТЬ:
Если у вас есть список всех почтовых индексов в США, полностью автоматизированным решением является использование службы под названием nominatim of openstreetmap (с учетом их TOC!)
1) получить lat, lon (центральная точка или адрес по умолчанию) каждого почтового индекса:
https://nominatim.openstreetmap.org/search/?format=xml&addressdetails=1&limit=1&country_codes=us&postalcode=35051
2) получить соответствующий адрес этого lat, lon:
https://nominatim.openstreetmap.org/reverse?format=xml&lat=33.178764&lon=-86.619038&zoom=18&addressdetails=1
попытка этого примера для Columbiana в Алабаме (почтовый индекс 35051) дает 397 West College Street.
Документация Nominatim находится по адресу: https://wiki.openstreetmap.org/wiki/Nominatim.
person
Lynx-Lab
schedule
27.04.2018