У меня есть приложение, которое будет хранить и отслеживать посетителей. Эти посетители создаются в системе планировщиками (пользователями) по мере необходимости при настройке посещения. Проблема в том, что в большинстве случаев единственными важными уникальными идентификаторами посетителя являются следующие:
- Имя
- Фамилия
- название компании
Риск дублирования записей, существующих для одного и того же человека, является неотъемлемым, планировщик может ввести новую запись о посетителе вместо поиска в системе кого-либо, существующего с этим именем.
Когда я сталкиваюсь с кем-то, входящим в посетителя с таким же именем, я показываю диалоговое окно с предупреждением с различными предложениями о том, кем этот человек МОЖЕТ быть, но даже этого недостаточно.
Я мог бы ввести «Джим Джонс», и этот человек может существовать в системе как «Джеймс Джонс» или «Джимми Джонс». Я вижу, что есть пакеты программного обеспечения для распознавания имен, но они дорогие и, безусловно, более тяжелые, чем то, что я ищу.
Кто-нибудь знает, где найти бесплатный или открытый файл словаря, к которому я могу получить программный доступ, чтобы найти возможные варианты имени? Программное обеспечение или онлайн-сервис было бы неплохо, но подойдет даже просто дамп данных или простой текстовый файл.
Я знаю, что даже это не предотвратит дублирование записей о посетителях, я просто стараюсь свести это к минимуму, поэтому это не критичная функция.