Предположим, я обучил модель doc2vec с 50000 документами и хочу вывести векторы для отдельного набора данных, содержащего 36000 документов. В этом случае будут ли выведенные векторы эффективны для последующей задачи классификации, поскольку я предполагаю, что предполагаемые векторы зависят от размера документов, с которыми обучается модель.
Примечание. Оба набора данных, то есть один, который используется для обучения doc2vec, а другой для вывода векторов, уникальны, но относятся к одной области верховного суда США.
Пожалуйста, поправьте меня, если я ошибаюсь по уважительной причине.