я пытаюсь построить модель, основанную на глубоком обучении, для извлечения определенного текста из длинных предложений.
Предположим, текст из 200 слов и таблица, в которой у меня есть имя и фамилия моего клиента. Я пытаюсь построить модель для извлечения из этих 200 слов имени/фамилии конкретного клиента с использованием глубокого обучения.
Я читал о моделях CNN и RNTN, семантическом анализе и моделях word2vec, но, очевидно, я не профессионал в этой области.
Мои мысли таковы:
- Шаг 1: создайте 1-ю модель, где ввод = фамилия клиента, вывод = фамилия класса
- Шаг 2: создайте вторую модель, где ввод = имя клиента, вывод = имя класса
- шаг 3: создайте 3-ю модель, где ввод = имя клиента + фамилия и фамилия + имя, вывод = класс клиента
- Шаг 4: создайте 4-ю модель, в которой я отправляю набор слов на вход и нахожу способ найти класс клиента на выходе.
Точно так же, как мы можем найти существительное/наречие/глагол/..., мы должны быть в состоянии создать своего рода новую "семантическую сортировку" как клиент, адрес,....
Может ли кто-нибудь дать мне несколько советов о моем образе мышления? или скажите мне, какую часть я должен изменить/улучшить?
Большое спасибо.