Я хочу найти в текстовом файле заданное слово, которое при желании может быть расставлено через дефис в неизвестной позиции внутри слова и разбито на следующие друг за другом строки.
например. соответствует "через дефис" в:
This sentence contains a hyphena-
ted word.
Ближайшее (непривлекательное) решение:
"h\(-\s*\n\s*\)\?y\(-\s*\n\s*\)\?p\(-\s*\n\s*\)\?h\(-\s*\n\s*\)\?e\(-\s*\n\s*\)\?n\(-\s*\n\s*\)\?a\(-\s*\n\s*\)\?t\(-\s*\n\s*\)\?e\(-\s*\n\s*\)\?d"
Я надеюсь, что какое-нибудь регулярное выражение-foo, более сильное, чем мое, сможет предложить регулярное выражение, которое явно включает искомое слово, т.е. Я бы хотел видеть там слово «через дефис». Я не нашел способа закодировать что-то вроде следующего (что в любом случае было бы ошибочным, поскольку соответствовало бы "hy-ted"):
"{prefix-of:hyphenated}{hyphen/linebreak}{suffix-of:hyphenated}"
Я понимаю, что предварительная обработка документа для свертывания таких слов упростит поиск, но я ищу регулярное выражение, которое я могу использовать в контексте, где это невозможно из-за задействованных инструментов.