Вопросы по теме 'string-algorithm'

Найти все конкатенации двух строк в огромном наборе
Учитывая набор из 50 тыс. Строк, мне нужно найти все пары (s, t) , такие, что s , t и s + t все содержатся в этом наборе. Что я пробовал , есть дополнительное ограничение: s.length() >= 4 && t.length() >= 4 . Это позволяет...
159 просмотров
schedule 23.11.2021

Найдите слова в длинном потоке символов. Авто-токенизация
Как найти правильные слова в длинном потоке символов? Вход : "The revised report onthesyntactictheoriesofsequentialcontrolandstate" Вывод Google: "The revised report on syntactic theories sequential controlandstate" (что...
2176 просмотров

Как хранить строки для оптимизации поиска
У меня есть таблица, содержащая столбец типа VARCHAR. Я хочу искать строки внутри столбца в соответствии с запросом пользователя. Я хочу реализовать приблизительный поиск. И моя таблица содержит Lacs записей. Я думаю, что есть несколько способов...
266 просмотров
schedule 22.05.2023

Альтернатива расстоянию Левенштейна для префиксов/суффиксов
У меня есть большая городская база данных, составленная из множества разных источников. Я пытаюсь найти способ легко обнаруживать дубликаты по названию города. Наивным ответом было бы использование расстояния Левенштейна. Однако проблема с городами...
1897 просмотров

Массив LCP для массива суффиксов
Как вычислить массив LCP для массива суффиксов? Он не должен быть самым эффективным. O(n log n) или O(n) подойдет. Что-то относительно легко закодировать, если это возможно.
242 просмотров

временная сложность python str.index
Для нахождения позиции подстроки внутри строки наивный алгоритм займет O(n^2) времени. Однако при использовании некоторых эффективных алгоритмов (например, алгоритм KMP ), это может быть достигнуто за время O(n): s = 'saurabh' w = 'au' def...
2452 просмотров

подсчет палиндромов быстрая оптимизация
Здравствуйте, у меня вопрос по оптимизации алгоритма подсчета палиндромов. Задача: найти количество палиндромов в строке. в моей функции я использую метод «в лоб», это похоже на O (n ^ 2), вы, ребята, можете помочь сделать это за O (n) или...
2197 просмотров
schedule 04.03.2023

Как я могу реализовать ввод списка массивов для алгоритма подобия строк?
Я реализовал алгоритм jarowinkler . В этом алгоритме я взял источник строки и цель строки. Строковая цель, принимаемая в качестве входной строки, исходная строка принимается в качестве массива, такого как источник [0]. Как можно реализовать...
121 просмотров