Как искать текст в файлах Microsoft Word (.doc или .docx) из командной строки или в пакетном режиме?

Мне нужно найти текст или фразы в файлах Microsoft Word (.doc и .docx) в нескольких каталогах.

Я хотел бы использовать командные строки или какой-нибудь файл .bat или .sh (я могу выполнить в Windows или Ubuntu ....).

Я видел, что есть несколько советов по использованию VBA в Microsoft Word, но я бы предпочел другой способ ......

Есть ли какой-нибудь инструмент/библиотека или что-то еще по этому вопросу?

Какие-либо предложения? Заранее большое спасибо!!!

Чезаре


person Cesare    schedule 10.02.2016    source источник
comment
Команда FINDSTR будет работать с файлами .DOC, но не с файлами .DOCX.   -  person Squashman    schedule 10.02.2016


Ответы (1)


Инструментов много, но не все имеют параметры командной строки. Эти ссылки объясняют некоторые возможности: https://www.smashingmagazine.com/2009/04/25-text-batch-processing-tools-reviewed/

PowerGrep может выполнять поиск в файлах MS-Word и имеет параметр командной строки:

PowerGrep может быстро искать текстовые и двоичные файлы, сжатые архивы, документы MS Word, электронные таблицы Excel, файлы PDF, документы OpenOffice, электронные таблицы Lotus, Zip-файлы и многое другое в сети и на ПК. Регулярные выражения можно использовать для удобного указания текста для поиска. Самое приятное то, что вы можете искать двоичные данные, а также слова и фразы. После поиска и замены у вас есть возможность просмотреть результаты без изменения каких-либо файлов. Вы также получаете выгоду от гибких опций резервного копирования и отмены, которые являются вишенкой на торте.

PowerGrep работает в Windows 98/ME/NT4/2000/XP/Vista. Еще одна функция, которая мне нравится, — это возможность сохранять действия PowerGREP и вызывать их из командной строки для автоматизации повторяющихся задач. Разработчики могут интегрировать действия и результаты PowerGREP с корпоративным программным обеспечением через открытые форматы файлов PowerGREP XML.

person Rumoch    schedule 10.02.2016