Вопросы по теме 'sentence-similarity'

word2vec, сумма или среднее вложение слов?
Я использую word2vec, чтобы представить небольшую фразу (от 3 до 4 слов) как уникальный вектор, либо добавляя каждое отдельное вложение слова, либо вычисляя среднее значение вложений слов. Из проведенных мною экспериментов я всегда получаю одно и...
5990 просмотров

Я хочу извлечь предложения, содержащие название лекарства и гена из 10 000 статей.
Я хочу извлечь предложения, содержащие название лекарства и гена из 10 000 статей. и мой код import re import glob import fnmatch import nltk from nltk.tokenize import sent_tokenize, word_tokenize flist= glob.glob ("C:/Users/Emma...
643 просмотров
schedule 16.11.2021

Как импортировать документ с предложениями для обучения модели doc2vec?
Я хочу получить косинусное сходство между предложениями. Я протестировал doc2vec с помощью gensim и обучил его, используя всего несколько предложений, приведенных в коде. Но я хочу обучить свою модель с помощью текстового документа, в каждой строке...
233 просмотров

подобие предобученных предложений fasttext
Я хочу использовать предварительно обученные модели fasttext для вычисления сходства предложения между набором предложений. Может кто-нибудь мне помочь? какой подход лучше? Я вычислил сходство между предложениями, обучив tfidf-модели. напишите...
3635 просмотров

Каков формат ввода fastText и почему моя модель не дает мне значимого аналогичного вывода?
Моя цель - найти сходство между словом и документом. Например, я хочу найти сходство между новым и документом, для простоты скажем Hello World !. Я использовал word2vec от gensim, но проблема в том, что он не находит сходства с невидимым словом....
313 просмотров

Получить процент сходства для нескольких строк
Есть ли какая-нибудь функция внутри Python, которая может принимать несколько строк строк и возвращать процент их сходства? что-то вроде SequenceMatcher , но для нескольких строк. Например, у нас есть следующие предложения Hello how are you?...
555 просмотров

Семантическое сходство между предложениями в тексте
Я использовал материалы из здесь и предыдущую страницу форума, чтобы написать код для программы, которая будет автоматически вычислять семантическое сходство между последовательными предложениями во всем тексте. Вот; Код для первой части...
1645 просмотров

Как определить, говорят ли два предложения об одинаковых темах?
Я хотел бы задать вам вопрос. Есть ли какой-нибудь алгоритм/инструмент, который может позволить мне установить связь между словами? Например: у меня есть следующая группа предложений: (1) "My phone is on the table" "I...
990 просмотров
schedule 30.06.2023

оценивает короткие тексты по сходству семантической сети
У меня есть программа, которая оценивает короткие тексты. Он дает исходный текст и передается в смысловую сеть. Затем сравнивается с несколькими короткими текстами, которые также преобразуются в семантическую сеть. Сходство между исходным текстом и...
66 просмотров