извлечь текст из .doc (не docx)

Я проверил мои вопросы и ответы в stackoverflow и других, есть много способов открыть и прочитать файл .docx, а не документ, с помощью python.

Я уже проверил библиотеку python-docx, но она поддерживает только docx.

Я хочу открыть и извлечь текст из файла .doc (не docx). Пожалуйста, помогите мне, потому что я новичок в python


person user3732708    schedule 20.04.2017    source источник


Ответы (1)


Вы можете использовать Tika Python, это привязки Apache Tika для python. Еще одна хорошая библиотека — это text.

person Ilia P    schedule 16.05.2017
comment
Ни один из них не является полезным. Text был для Python2, а не для Python3. - person Tedo Vrbanec; 31.03.2019