Публикации по теме 'edit-distance'


Динамическое искажение времени при анализе временных рядов
Введение Сельское хозяйство играет очень важную роль в такой развивающейся стране, как Индия. На его долю приходится около 20 процентов ВВП, а 58 процентов населения Индии связано с сельским хозяйством. Пшеница является одним из основных продуктов питания в Индии. Машинное обучение играет большую роль в сельском хозяйстве на различных этапах уборки урожая для повышения урожайности, прогнозирования погоды, выявления болезней и вредителей и т. д. Сезонный рост пшеницы изучается за..

Вопросы по теме 'edit-distance'

Как рассчитать разницу между двумя последовательностями точек?
У меня есть две последовательности длины n и m. Каждая представляет собой последовательность точек формы (x, y) и представляет собой кривые на изображении. Мне нужно выяснить, насколько разные (или похожие) эти последовательности имеют тот факт, что...
3060 просмотров
schedule 12.10.2021

Изменить расстояние между двумя графиками
Мне просто интересно, есть ли что-то подобное для графиков, например, для строк, где у нас есть расстояние Левенштейна (или расстояние редактирования) между двумя строками? Я имею в виду скалярную меру, которая определяет количество атомарных...
9832 просмотров

Python: эффективный способ найти расстояние редактирования Левенштейна в матрице
Я хотел бы выявить сходство между двумя списками, после чего я хочу выполнить кластеризацию описаний. L2D1 L2D2 L2D2 .........L2Dn L1D1 0 0.3 0.8............0.5 L1D2 0.2 0.7 0.3............0.2...
721 просмотров

Как посчитать kNN с манхэттенским расстоянием в R?
В программе расстояние евклидово (что по умолчанию). Как изменить его на Манхэттен? Код: wdbc <- read.table(file.choose(), sep=",") View(wdbc) wdbc <- wdbc[, -1] data_norm <- function(x) {((x - min(x))/ (max(x)- min(x)))} wdbc_norm...
634 просмотров

В чем разница между расстоянием Левенштейна и алгоритмом Вагнера-Фишера
Расстояние Левенштейна - это строковая метрика для измерения разницы между двумя последовательностями. Алгоритм Вагнера – Фишера - это алгоритм динамического программирования, который вычисляет расстояние редактирования между двумя строками символов....
2529 просмотров

Формула расстояния Левенштейна в CoffeeScript?
Я пытаюсь создать или найти реализацию CoffeeScript формулы расстояния Левенштейна, также известную как Edit Distance. Вот что у меня есть до сих пор, любая помощь будет очень признательна. levenshtein = (s1,s2) -> n = s1.length m =...
552 просмотров

Нормализация расстояния редактирования графика до [0,1] (networkx)
Я хочу иметь нормализованное расстояние редактирования графика. Я использую эту функцию:...
409 просмотров

Создайте большое количество случайных последовательностей с минимальным расстоянием редактирования, эффективным по времени
Мне нужно создать программу/скрипт для создания большого количества случайных последовательностей (длинная последовательность из 20 букв, основанная на 4 разных буквах) с минимальным расстоянием редактирования между всеми последовательностями....
56 просмотров

Нечеткий текстовый поиск Oracle с подстановочными знаками
У меня есть база данных SAP Oracle, полная данных о клиентах. В нашей пользовательской CRM довольно часто для поиска клиентов используются подстановочные знаки. В дополнение к стандартному поиску SAP мы хотели бы выполнить нечеткий текстовый поиск...
5129 просмотров

Как сгруппировать предложения по расстоянию редактирования?
У меня есть большой набор (36 тысяч предложений) предложений (текстовый список) и их теги POS (список POS), и я хотел бы сгруппировать/кластеризовать элементы в списке POS, используя расстояние редактирования/Левенштейн: (например, POS-теги Sentx =...
463 просмотров

Изменить расстояние между отметками оси x в ggplot2
Прямо сейчас я создаю линейный график с тремя наблюдениями. Следовательно, есть три деления по оси x. Я хочу вручную уменьшить расстояние между отметками оси X и заставить наблюдения быть ближе друг к другу. Другими словами, я хочу уменьшить...
21677 просмотров
schedule 25.05.2023

Расстояние Левенштейна с весом/штрафом за смежность
Я использую расстояние редактирования строки (расстояние Левенштейна) для сравнения путей сканирования из эксперимента по отслеживанию взгляда. (Сейчас я использую пакет stringdist в R) В основном буквы строк относятся к положению (взгляда) в...
6788 просмотров

Алгоритм более быстрого редактирования расстояния
Проблема: я знаю тривиальную формулировку DP расстояния редактирования и вычисление за O(mn) для двух строк размера n и m соответственно. Но недавно я узнал, что если нам нужно вычислить только минимальное значение расстояния редактирования f и оно...
2728 просмотров

Запутался насчет расстояния редактирования
Используя расстояние редактирования, я должен найти, сколько правок между двумя строками, что я уже сделал в своем коде ниже, но часть, на которой я застрял, — это печать массива 2d, вывод которого должен выглядеть следующим образом: int...
111 просмотров
schedule 09.10.2023

Рассчитать процент расстояния редактирования
Я пытаюсь получить процент расстояния редактирования из группы последовательностей. Пока это то, что у меня есть: library(stringdist) sequence <- c("CA--------W----------------------EKDRRTEAF---F------",...
165 просмотров

Быстрая проверка большой базы данных на сходство расстояния редактирования
У меня есть база данных из 350,000 строк со средней длиной около 500 . Строки не состоят из слов, они представляют собой по существу случайный набор символов. Мне нужно убедиться, что никакие две строки не слишком похожи, где сходство...
1097 просмотров

Доказательство расстояния редактирования между графами без ребер является метрикой
Проблема заключается в нахождении минимального расстояния редактирования между двумя графами без ребер, учитывая, что могут быть разные затраты на добавление, удаление или замену вершин. Мне сказали, что это расстояние является метрикой, и есть...
257 просмотров
schedule 01.04.2023

Каков наилучший способ сравнения строк для поиска совпадающих слов в Python?
У меня есть два текста: текст A и текст B. Текст B не является точной копией текста A, в нем много специальных символов, которых нет в тексте A, но технически это тот же текст. Мне нужно сравнить строки и сопоставить аналоги в тексте B с их аналогами...
1005 просмотров

Эффективное расстояние редактирования
У меня большой корпус, и я пытаюсь найти в корпусе наиболее похожие n-граммы. В этом случае я использую get_close matches . Проблема в том, что эта процедура занимает много времени. Друг предлагает мне преобразовать n-граммы в MD5, а затем...
75 просмотров
schedule 16.12.2022

Выберите похожие предложения
Если у меня есть набор предложений, и я хочу извлечь дубликаты, я должен работать, как в следующем примере: sentences<-c("So there I was at the mercy of three monstrous trolls", "Today is my One Hundred and Eleventh...
57 просмотров
schedule 14.01.2024