Публикации по теме 'cosine-similarity'


Косинусное сходство — измерение сходства между несколькими изображениями.
Введение: Если вы использовали iPhone серии X и выше, вы должны быть знакомы с функцией Face ID, которая позволяет вам контролировать доступ к различным функциям вашего телефона, некоторые из которых включают разблокировку телефона, предоставление доступа к загрузкам и создание онлайн-платежи. Если это слишком расплывчатая картина, чтобы нарисовать ее, вы наверняка задавались вопросом: «Как я могу заставить свой компьютер обнаруживать сходство между двумя изображениями». Эта статья..

Как проверить сходство косинусов в двух столбцах данных
В предыдущем посте в блоге я обсуждал, как измерить косинусное сходство между двумя или более строками текста, но в этом посте я решил провести измерение между двумя столбцами текста в фрейме данных. В анализе данных сходство косинусов является мерой сходства между двумя последовательностями чисел. Поскольку я сравнивал образцы текста, мне было необходимо…

Расстояния подобия для обработки естественного языка
Важность хорошего текстового представления: Разработка и выбор функций, безусловно, является одним из самых важных шагов любого проекта машинного обучения. Независимо от того, какой алгоритм вы решите использовать, если функция, которую вы ему предоставляете, плохая, результаты, которые вы собираетесь получить, тоже будут плохими. Это хорошо выражено выражением: «мусор на входе, мусор на выходе». Разработка функций оптимальна только в том случае, если мы хорошо знаем проблему и..

Вопросы по теме 'cosine-similarity'

Можно ли смоделировать косинусное подобие в Solr / Lucene?
Меня интересуют возможные способы моделирования алгоритма косинусного сходства с использованием Solr. У меня есть элементы, которым назначен вектор, например: items = [ { id: 1, vector: [0,0,0,2,3,0,0] }, { id: 2, vector: [0,1,0,1,5,0,0] },...
1117 просмотров
schedule 25.11.2021

Как вычислить косинусное сходство с использованием двух матриц
У меня есть две матрицы: A (размеры M x N) и B (N x P). Фактически, это коллекции векторов - векторы-строки в A, векторы-столбцы в B. Я хочу получить оценки сходства косинусов для каждой пары a и b , где a - вектор (строка) из матрицы A, а b -...
10469 просмотров
schedule 06.12.2021

word2vec, сумма или среднее вложение слов?
Я использую word2vec, чтобы представить небольшую фразу (от 3 до 4 слов) как уникальный вектор, либо добавляя каждое отдельное вложение слова, либо вычисляя среднее значение вложений слов. Из проведенных мною экспериментов я всегда получаю одно и...
5990 просмотров

Как применить фильтрацию на основе содержимого в ne04j
У меня есть данные в формате ниже, где 1-й столбец представляет узел продуктов, все следующие столбцы представляют свойства продуктов. Я хочу применить алгоритм фильтрации на основе контента с использованием косинусного сходства в Neo4j. Для этого,...
56 просмотров
schedule 08.11.2021

Neo4j - Как рассчитать косинусное сходство на основе нескольких атрибутов для данного узла
У меня есть база данных Neo4j с n пользователями. Каждый пользователь подключен к соответствующему узлу пола (M и F), узлу возрастной группы, узлу этнической принадлежности и т. Д. Я хочу найти сходство между двумя пользователями на основе их пола,...
757 просмотров

Косинусное сходство строк в pandas DataFrame
Я вычислил косинусное подобие фрейма данных, как показано ниже: ciiu4n4 A0111 A0112 A0113 A0111 14 7 6 A0112 16 55 3 A0113 15 0 112 используя этот код: data_cosine =...
5502 просмотров

Как вычислить матрицу попарного косинусного сходства между словами в одном текстовом файле
Привет всем :) Я пытаюсь кодировать на Python, чтобы вычислить (и распечатать) матрицу сходства косинусов между словами в текстовом файле. Итак, например, у меня есть этот текстовый файл: f.txt: "привет, меня зовут Сара, и теперь я ищу вашу...
1332 просмотров
schedule 05.11.2021

Как импортировать документ с предложениями для обучения модели doc2vec?
Я хочу получить косинусное сходство между предложениями. Я протестировал doc2vec с помощью gensim и обучил его, используя всего несколько предложений, приведенных в коде. Но я хочу обучить свою модель с помощью текстового документа, в каждой строке...
233 просмотров

Косинусное сходство и сходство TS-SS среди документов с использованием tf-idf - Python
Распространенным способом вычисления косинусного сходства между текстовыми документами является вычисление tf-idf, а затем вычисление линейного ядра матрицы tf-idf. Матрица TF-IDF рассчитывается с помощью TfidfVectorizer (). from...
445 просмотров

Минимальный объем данных для совместного фильтра на основе элементов
Я работаю над механизмом рекомендаций, который использует совместный фильтр на основе элементов для создания рекомендаций для ресторанов. У каждого ресторана есть отзывы с рейтингом от 1 до 5. Каждый алгоритм рекомендации борется с проблемой...
497 просмотров

Как получить косинусное сходство сложности в Matlab?
Я реализовал косинусное сходство в Matlab следующим образом. На самом деле у меня есть двумерная матрица 50 на 50. Чтобы получить косинус, я должен сравнивать элементы в построчной форме. for j = 1:50 x = dat(j,:); for i = j+1:50...
2670 просмотров
schedule 13.03.2022

scikit Learn Ошибка типа Только целочисленные массивы с одним элементом могут быть преобразованы в индекс
Я получаю следующую ошибку при вызове cosine_similarity numerator = sum(a*b for a,b in zip(x,y)) TypeError: only integer arrays with one element can be converted to an index Я пытаюсь получить матрицу совпадения ключевого слова и ключевого...
599 просмотров
schedule 25.03.2022

Как использовать косинусное сходство для этого варианта использования?
Если у меня есть вектор запроса A и вектор элементов B, было бы здорово, если бы кто-нибудь помог мне взвесить/нормализовать векторы (стратегии для одного и того же). Вектор A будет иметь следующие компоненты ( свойство1 (двоичное), свойство2...
340 просмотров

вычисление сходства косинусов с использованием MapReduce
Я пытаюсь сделать рекомендацию на основе элементов, используя косинусное сходство с MapReduce. Вот входной набор. itemIdx_1, userIdx_1 itemIdx_1, userIdx_2 itemIdx_2, userIdx_1 itemIdx_3, userIdx_3 ... Как мне проектировать с этими...
1187 просмотров

Машинное обучение. Какой подход использовать, когда набор данных содержит экземпляры только одного класса?
У меня есть набор данных определенного домена (скажем, спорт - 1 класс). Что я хочу сделать, так это когда я передал веб-страницу классификатору/кластеру, я хочу получить результат, связан ли этот экземпляр (веб-страница) со спортом или нет....
337 просмотров

косинусное сходство между двумя матрицами
У меня есть два массива размером 256x256, информация в них имеет две разные единицы (одна в метрах, а другая в градусах), когда я рисую их с помощью цветовой карты, изображения выглядят совершенно одинаково, но я знаю, что информация внутри них...
299 просмотров

ошибка при вычислении схожести текста с использованием scikitlearn
Я новичок в модели векторного пространства (VSM). И я попробовал код с этого сайта . Это очень хорошее введение в VSM, но мне каким-то образом удалось получить от автора другие результаты. Это может быть связано с некоторыми проблемами...
1611 просмотров

Взвешенное косинусное подобие на разреженных векторах
Я пытаюсь вычислить сходство между двумя разреженными векторами, используя косинусное сходство. который работает нормально. Тем не менее, я хотел бы сделать дополнительный шаг, введя взвешивание для каждого индекса вектора. например где векторы...
622 просмотров
schedule 03.07.2022

Mahout: скорректировано косинусное сходство для рекомендателя на основе элементов.
Для задания я должен протестировать различные типы рекомендателей, которые я должен реализовать в первую очередь. Я искал хорошую библиотеку для этого (сначала я думал о Weka) и наткнулся на Mahout. Поэтому я должен заявить, что: а) я совершенно...
1302 просмотров

Как измерить качество оценок сходства косинусов в разных векторных пространствах?
Я ученый-компьютерщик, работающий над проблемой, которая требует некоторых статистических измерений, хотя (не очень хорошо разбираясь в статистике) я не совсем уверен, какую статистику использовать. Обзор: У меня есть ряд вопросов (конечно, с...
1973 просмотров