Публикации по теме 'edit-distance'
Динамическое искажение времени при анализе временных рядов
Введение
Сельское хозяйство играет очень важную роль в такой развивающейся стране, как Индия. На его долю приходится около 20 процентов ВВП, а 58 процентов населения Индии связано с сельским хозяйством. Пшеница является одним из основных продуктов питания в Индии. Машинное обучение играет большую роль в сельском хозяйстве на различных этапах уборки урожая для повышения урожайности, прогнозирования погоды, выявления болезней и вредителей и т. д.
Сезонный рост пшеницы изучается за..
Вопросы по теме 'edit-distance'
Как рассчитать разницу между двумя последовательностями точек?
У меня есть две последовательности длины n и m. Каждая представляет собой последовательность точек формы (x, y) и представляет собой кривые на изображении. Мне нужно выяснить, насколько разные (или похожие) эти последовательности имеют тот факт, что...
3060 просмотров
schedule
12.10.2021
Изменить расстояние между двумя графиками
Мне просто интересно, есть ли что-то подобное для графиков, например, для строк, где у нас есть расстояние Левенштейна (или расстояние редактирования) между двумя строками?
Я имею в виду скалярную меру, которая определяет количество атомарных...
9832 просмотров
schedule
15.09.2021
Python: эффективный способ найти расстояние редактирования Левенштейна в матрице
Я хотел бы выявить сходство между двумя списками, после чего я хочу выполнить кластеризацию описаний.
L2D1 L2D2 L2D2 .........L2Dn
L1D1 0 0.3 0.8............0.5
L1D2 0.2 0.7 0.3............0.2...
721 просмотров
schedule
20.11.2021
Как посчитать kNN с манхэттенским расстоянием в R?
В программе расстояние евклидово (что по умолчанию). Как изменить его на Манхэттен?
Код:
wdbc <- read.table(file.choose(), sep=",")
View(wdbc)
wdbc <- wdbc[, -1]
data_norm <- function(x) {((x - min(x))/ (max(x)- min(x)))}
wdbc_norm...
634 просмотров
schedule
27.04.2022
В чем разница между расстоянием Левенштейна и алгоритмом Вагнера-Фишера
Расстояние Левенштейна - это строковая метрика для измерения разницы между двумя последовательностями. Алгоритм Вагнера – Фишера - это алгоритм динамического программирования, который вычисляет расстояние редактирования между двумя строками символов....
2529 просмотров
schedule
13.05.2022
Формула расстояния Левенштейна в CoffeeScript?
Я пытаюсь создать или найти реализацию CoffeeScript формулы расстояния Левенштейна, также известную как Edit Distance. Вот что у меня есть до сих пор, любая помощь будет очень признательна.
levenshtein = (s1,s2) ->
n = s1.length
m =...
552 просмотров
schedule
05.06.2022
Нормализация расстояния редактирования графика до [0,1] (networkx)
Я хочу иметь нормализованное расстояние редактирования графика. Я использую эту функцию:...
409 просмотров
schedule
11.06.2022
Создайте большое количество случайных последовательностей с минимальным расстоянием редактирования, эффективным по времени
Мне нужно создать программу/скрипт для создания большого количества случайных последовательностей (длинная последовательность из 20 букв, основанная на 4 разных буквах) с минимальным расстоянием редактирования между всеми последовательностями....
56 просмотров
schedule
28.06.2022
Нечеткий текстовый поиск Oracle с подстановочными знаками
У меня есть база данных SAP Oracle, полная данных о клиентах. В нашей пользовательской CRM довольно часто для поиска клиентов используются подстановочные знаки. В дополнение к стандартному поиску SAP мы хотели бы выполнить нечеткий текстовый поиск...
5129 просмотров
schedule
24.08.2022
Как сгруппировать предложения по расстоянию редактирования?
У меня есть большой набор (36 тысяч предложений) предложений (текстовый список) и их теги POS (список POS), и я хотел бы сгруппировать/кластеризовать элементы в списке POS, используя расстояние редактирования/Левенштейн:
(например, POS-теги Sentx =...
463 просмотров
schedule
18.09.2022
Изменить расстояние между отметками оси x в ggplot2
Прямо сейчас я создаю линейный график с тремя наблюдениями. Следовательно, есть три деления по оси x.
Я хочу вручную уменьшить расстояние между отметками оси X и заставить наблюдения быть ближе друг к другу. Другими словами, я хочу уменьшить...
21677 просмотров
schedule
25.05.2023
Расстояние Левенштейна с весом/штрафом за смежность
Я использую расстояние редактирования строки (расстояние Левенштейна) для сравнения путей сканирования из эксперимента по отслеживанию взгляда. (Сейчас я использую пакет stringdist в R)
В основном буквы строк относятся к положению (взгляда) в...
6788 просмотров
schedule
10.03.2023
Алгоритм более быстрого редактирования расстояния
Проблема: я знаю тривиальную формулировку DP расстояния редактирования и вычисление за O(mn) для двух строк размера n и m соответственно. Но недавно я узнал, что если нам нужно вычислить только минимальное значение расстояния редактирования f и оно...
2728 просмотров
schedule
04.11.2022
Запутался насчет расстояния редактирования
Используя расстояние редактирования, я должен найти, сколько правок между двумя строками, что я уже сделал в своем коде ниже, но часть, на которой я застрял, — это печать массива 2d, вывод которого должен выглядеть следующим образом:
int...
111 просмотров
schedule
09.10.2023
Рассчитать процент расстояния редактирования
Я пытаюсь получить процент расстояния редактирования из группы последовательностей. Пока это то, что у меня есть:
library(stringdist)
sequence <- c("CA--------W----------------------EKDRRTEAF---F------",...
165 просмотров
schedule
27.02.2023
Быстрая проверка большой базы данных на сходство расстояния редактирования
У меня есть база данных из 350,000 строк со средней длиной около 500 . Строки не состоят из слов, они представляют собой по существу случайный набор символов.
Мне нужно убедиться, что никакие две строки не слишком похожи, где сходство...
1097 просмотров
schedule
11.10.2023
Доказательство расстояния редактирования между графами без ребер является метрикой
Проблема заключается в нахождении минимального расстояния редактирования между двумя графами без ребер, учитывая, что могут быть разные затраты на добавление, удаление или замену вершин.
Мне сказали, что это расстояние является метрикой, и есть...
257 просмотров
schedule
01.04.2023
Каков наилучший способ сравнения строк для поиска совпадающих слов в Python?
У меня есть два текста: текст A и текст B. Текст B не является точной копией текста A, в нем много специальных символов, которых нет в тексте A, но технически это тот же текст. Мне нужно сравнить строки и сопоставить аналоги в тексте B с их аналогами...
1005 просмотров
schedule
16.03.2023
Эффективное расстояние редактирования
У меня большой корпус, и я пытаюсь найти в корпусе наиболее похожие n-граммы. В этом случае я использую get_close matches .
Проблема в том, что эта процедура занимает много времени. Друг предлагает мне преобразовать n-граммы в MD5, а затем...
75 просмотров
schedule
16.12.2022
Выберите похожие предложения
Если у меня есть набор предложений, и я хочу извлечь дубликаты, я должен работать, как в следующем примере:
sentences<-c("So there I was at the mercy of three monstrous trolls",
"Today is my One Hundred and Eleventh...
57 просмотров
schedule
14.01.2024