В поле имени сырых данных составного домена DQS указаны имена людей и компании

Я пытаюсь создать базу знаний в SQL Server 2012 DQS. В необработанных данных, которые я пытаюсь запустить через DQS, у меня есть поле с полным именем, которое, к сожалению, может содержать как имена людей, так и имена компаний. Мне было интересно, есть ли у кого-нибудь совет о том, как очистить и проанализировать это поле с помощью DQS без необходимости покупать службу справочных данных, чтобы, если это название компании, оно помещало все поле в домен FirstName или LastName, но если это не компания name, затем он разбирает все имя в соответствующие домены.

Я создал составной домен с именем FullName, который состоит из доменов FirstName, MiddleName и LastName, и сопоставил его с моими необработанными данными. Затем я использовал анализ на основе составного домена знаний, чтобы попытаться проанализировать эти значения в соответствующих полях, но, к сожалению, он пытается анализировать названия компаний, как если бы они были людьми, поэтому я получаю много фамилий, таких как «& Associates Inc» и т. Д.

Кажется, что самый простой способ справиться с этим - создать домен бизнес-слов и иметь правило составного домена, которое в основном говорит, что если какое-либо из слов в домене FullName находится в домене BusinessWord, тогда поместите все имя в FirstName. домен, иначе попробуйте разобрать имя на первое, среднее и последнее. Этот тип поиска выходит за рамки возможностей DQS?

Пока что единственное, что я могу найти для правил DQS CD, - это создать правила, которые жестко запрограммированы, то есть, если город - «Лондон», тогда измените страну на «Англия», но я бы хотел более динамическое правило, которое говорит, что если BusinessWord In FullName, то поместите все это в FirstName. Просто интересно, сталкивался ли кто-нибудь, кто пробует DQS, с подобной проблемой, и можно ли ее решить без необходимости платить смехотворную сумму денег за службу справочных данных.

Если вы не можете очистить имена и адреса с помощью этой вещи, тогда для чего она нужна?

Заранее спасибо.


person DrRocket    schedule 12.03.2012    source источник


Ответы (1)


Я бы решил эту проблему, используя базу знаний в задаче DQS как часть рабочего процесса SSIS. В этом сообщении в блоге есть ссылка о том, как использовать задачу DQS. В вашей ситуации я бы использовал вывод столбца состояния (определите правило), а затем перенаправил бы вывод в соответствии с вашими бизнес-правилами с помощью дополнительных задач SSIS.

Я знаю, что это не идеально, но думаю, что это решит ближайшую задачу.

person Lynn Langit    schedule 18.05.2012