Я пытаюсь удалить каждый символ, повторяющийся более 2 раз, из очень длинной строки. Так, например, слово Terrrrrrific
становится Terrific
.
Теперь мой вопрос: как мне отфильтровать повторы, которые включают более одного символа, то есть, если у меня есть Words words words words words
, я хочу отфильтровать его до words words
, однако это может быть что-то менее разумное, например abcdabcdabcdabcdabcd
, которое должно стать abcdabcd
.
Я подозреваю, что мне следует использовать суффиксное дерево, но я не уверен, как именно использовать алгоритм.
words words words words words
также содержит 3 (перекрывающихся) повтора строкиwords words words
. - person j_random_hacker   schedule 30.06.2015