Вопросы по теме 'sentence-similarity'
word2vec, сумма или среднее вложение слов?
Я использую word2vec, чтобы представить небольшую фразу (от 3 до 4 слов) как уникальный вектор, либо добавляя каждое отдельное вложение слова, либо вычисляя среднее значение вложений слов.
Из проведенных мною экспериментов я всегда получаю одно и...
5990 просмотров
schedule
11.10.2021
Я хочу извлечь предложения, содержащие название лекарства и гена из 10 000 статей.
Я хочу извлечь предложения, содержащие название лекарства и гена из 10 000 статей. и мой код
import re
import glob
import fnmatch
import nltk
from nltk.tokenize import sent_tokenize, word_tokenize
flist= glob.glob ("C:/Users/Emma...
643 просмотров
schedule
16.11.2021
Как импортировать документ с предложениями для обучения модели doc2vec?
Я хочу получить косинусное сходство между предложениями. Я протестировал doc2vec с помощью gensim и обучил его, используя всего несколько предложений, приведенных в коде. Но я хочу обучить свою модель с помощью текстового документа, в каждой строке...
233 просмотров
schedule
24.09.2021
подобие предобученных предложений fasttext
Я хочу использовать предварительно обученные модели fasttext для вычисления сходства предложения между набором предложений. Может кто-нибудь мне помочь? какой подход лучше?
Я вычислил сходство между предложениями, обучив tfidf-модели. напишите...
3635 просмотров
schedule
08.04.2022
Каков формат ввода fastText и почему моя модель не дает мне значимого аналогичного вывода?
Моя цель - найти сходство между словом и документом. Например, я хочу найти сходство между новым и документом, для простоты скажем Hello World !.
Я использовал word2vec от gensim, но проблема в том, что он не находит сходства с невидимым словом....
313 просмотров
schedule
08.04.2022
Получить процент сходства для нескольких строк
Есть ли какая-нибудь функция внутри Python, которая может принимать несколько строк строк и возвращать процент их сходства? что-то вроде SequenceMatcher , но для нескольких строк.
Например, у нас есть следующие предложения
Hello how are you?...
555 просмотров
schedule
04.07.2022
Семантическое сходство между предложениями в тексте
Я использовал материалы из здесь и предыдущую страницу форума, чтобы написать код для программы, которая будет автоматически вычислять семантическое сходство между последовательными предложениями во всем тексте. Вот;
Код для первой части...
1645 просмотров
schedule
10.02.2023
Как определить, говорят ли два предложения об одинаковых темах?
Я хотел бы задать вам вопрос. Есть ли какой-нибудь алгоритм/инструмент, который может позволить мне установить связь между словами? Например: у меня есть следующая группа предложений:
(1)
"My phone is on the table"
"I...
990 просмотров
schedule
30.06.2023
оценивает короткие тексты по сходству семантической сети
У меня есть программа, которая оценивает короткие тексты. Он дает исходный текст и передается в смысловую сеть. Затем сравнивается с несколькими короткими текстами, которые также преобразуются в семантическую сеть. Сходство между исходным текстом и...
66 просмотров
schedule
06.08.2023