разобрать pdf с помощью ruby pdf-reader

Я пытаюсь разобрать pdf с помощью pdf-reader gem. Я изучил несколько методов и метод отображения конкретной страницы PDF показывает правильные данные (даже если столбец таблицы имеет более одной строки, он показывает этот конкретный столбец как объединенный), но он дает возвращаемое значение как nil, поэтому есть ли способ, которым мы можем получить значения, отображаемые этим методом?. Также я пытался использовать текстовый метод, но проблема в том, что в pdf у меня есть таблица, подобная структуре, и один столбец таблицы может иметь более одной строки, и по этой причине текстовый метод не показывает значения по порядку, поэтому он отображается первым строка, затем вторая строка и так далее. Поэтому становится немного сложно судить, какой конкретный столбец имеет более одной строки. Любое решение для решения этой проблемы?

reader = PDF::Reader.new(io)
reader.page(1).display #display methods print nice pdf data but return nil
reader.page(1).text #display pdf text but does not show value in order (in case of table)

ruby pdf-reader

Muhammad Adeel 12.07.2019 источник

Ответы (1)

arrow_upward
0
arrow_downward

Как насчет того, чтобы попробовать код ниже

reader = PDF::Reader.new(io)
puts reader.page(1).display #display methods print nice pdf data but return nil
puts reader.page(1).text #display pdf text but does not show value in order (in case of table)

displayметод печатает только то, что не возвращает.

если вы хотите увидеть какой-либо результат. введите putsили p и попробуйте

samslow 12.07.2019

разобрать pdf с помощью ruby ​​pdf-reader

Ответы (1)

Вопросы по теме

разобрать pdf с помощью ruby pdf-reader