Ошибка поиска Adobe Reader XI, если установлен pdf fileIdentifier (/ ID)

Я являюсь участником класса pdf R&OS для команды разработчиков php и заметил странное поведение в Adobe Reader XI (11.0.5)

Когда файл pdf включает fileIdentifier (запись / ID в части трейлера) Adobe Reader не смог найти текстовое содержимое.

Как только я удалю запись / ID, поиск будет полностью функционировать.

Поиск Foxit Reader и Chrome reader работал в обоих случаях.

Кто-нибудь знает, почему Adobe Reader (AAR) так себя ведет?

Вдобавок я добавил оба pdf-файла на pastebin.com. Так что вы можете скачать и протестировать оттуда. Просто сохраните его с расширением ".pdf"

http://pastebin.com/an5NaZcv - поиск не удался

http://pastebin.com/ZyFZNQ36 - поиск ок

ДВОИЧНЫЙ ФАЙЛ, КОТОРЫЙ НЕ РАБОТАЕТ: исправлена ​​ошибка

Я сообщил об этом как об ошибке в своем приложении здесь: https://sourceforge.net/p/pdf-php/bugs/71/

Заранее благодарю


person Ole K    schedule 25.11.2013    source источник
comment
Я могу искать в обоих файлах, например, слово серый успешно с помощью Adobe Reader 11.0.5; с другой стороны, предоставление файлов через pastebin, службу, предназначенную для текстовых данных, могло нарушить некоторые важные аспекты. Я бы посоветовал использовать какой-нибудь файловый сервер для двоичных файлов.   -  person mkl    schedule 25.11.2013
comment
Вопрос настолько конкретен, что я думаю, что только Adobe может на него ответить, я согласен с @mkl, вставка двоичного файла в Pastebin может все испортить   -  person Noam Rathaus    schedule 25.11.2013
comment
Включено ли Fast Find в настройках?   -  person user2846289    schedule 25.11.2013
comment
ПРИМЕЧАНИЕ: эти PDF-файлы не содержат двоичных файлов. Так что копировать и вставлять безопасно. В любом случае я собираюсь загрузить двоичные файлы ... спасибо @mkl, какую ОС вы используете? Может быть, это потому, что я использую Windows 8.1 ?!   -  person Ole K    schedule 25.11.2013
comment
Тестировал на Windows 7 в офисе. Идею @VadimR тоже стоит проверить.   -  person mkl    schedule 25.11.2013
comment
эти файлы pdf не содержат двоичных файлов. - распространенное заблуждение. Файлы PDF являются двоичными файлами, даже если они выглядят как обычный текст.   -  person mkl    schedule 25.11.2013
comment
Что ж, однажды он меня укусил ... Отключите быстрый поиск, очистите кеш поиска, перезапустите Acrobat. Полезный вариант для людей, неприятная ловушка для разработчиков.   -  person user2846289    schedule 25.11.2013
comment
Сейчас я нахожусь на компьютере с Win8.1, и я мог искать все файлы с помощью Adobe Reader 11.0.4 и 11.0.5, и каждый раз мог находить «серый». Вы, вероятно, повторно использовали ID, который использовался в другом документе на вашем компьютере раньше? Может быть, предыдущая версия того же PDF-файла? Кстати, файл, доступный для двоичной загрузки, не заставлял Adobe Reader восстанавливать, в то время как он хотел восстанавливать текстовые.   -  person mkl    schedule 26.11.2013


Ответы (1)


Я почти уверен, что решил эту проблему, очистив кеш быстрого поиска в Adobe Reader.

Мое объяснение, почему возникает эта проблема:

Даже без шифрования функция быстрого поиска от Adobe Reader использует запись / ID (если она задана), чтобы каким-то образом идентифицировать все текстовое содержимое документа.

После того, как я очистил кеш быстрого поиска в разделе «Настройки -> Поиск», я снова смог искать

Поэтому в будущем я буду использовать что-то похожее на md5 (# timestamp #), чтобы убедиться, что каждый документ имеет свой собственный уникальный fileIdentifer, хранящийся в / ID записи трейлера документа.

Спасибо за подсказки

С уважением, Оле

person Ole K    schedule 25.11.2013
comment
Поэтому в будущем я буду использовать что-то похожее на md5 (# timestamp #), чтобы убедиться, что каждый документ имеет свой собственный уникальный fileIdentifer, хранящийся в / ID записи трейлера документа. - Я бы предложил следовать процедуре, как представлены в спецификации PDF. И ID - это ID, это ID. - person mkl; 26.11.2013
comment
Я полностью согласен, но я также думаю, что никто не знал, что это влияет на функцию быстрого поиска в AAR. В любом случае проблема решена. - person Ole K; 26.11.2013
comment
Для меня это тоже было внове, но @VadimR, похоже, уже сталкивался с подобным раньше. ;-) - person mkl; 26.11.2013