Я использую SOLR7 для полного извлечения файлов Windows doc. у меня такая ошибка:
но с SOLR 5.5 у меня нет ошибок, есть идеи?
Проблема возникает, когда в документе есть изображение. заголовок для изображения получен, и POI ожидает чего-то еще .... но заголовок из документа в порядке.
ожидаемый - из заголовка слова документа, другой - заголовок из изображения, например. парсер всегда ждет одного и того же заголовка, даже если в документе есть другой элемент. изменение парсера сделает трюк.