разобрать pdf с помощью ruby ​​pdf-reader

Я пытаюсь разобрать pdf с помощью pdf-reader gem. Я изучил несколько методов и метод отображения конкретной страницы PDF показывает правильные данные (даже если столбец таблицы имеет более одной строки, он показывает этот конкретный столбец как объединенный), но он дает возвращаемое значение как nil, поэтому есть ли способ, которым мы можем получить значения, отображаемые этим методом?. Также я пытался использовать текстовый метод, но проблема в том, что в pdf у меня есть таблица, подобная структуре, и один столбец таблицы может иметь более одной строки, и по этой причине текстовый метод не показывает значения по порядку, поэтому он отображается первым строка, затем вторая строка и так далее. Поэтому становится немного сложно судить, какой конкретный столбец имеет более одной строки. Любое решение для решения этой проблемы?

reader = PDF::Reader.new(io)
reader.page(1).display #display methods print nice pdf data but return nil
reader.page(1).text #display pdf text but does not show value in order (in case of table)

person Muhammad Adeel    schedule 12.07.2019    source источник


Ответы (1)


Как насчет того, чтобы попробовать код ниже

reader = PDF::Reader.new(io)
puts reader.page(1).display #display methods print nice pdf data but return nil
puts reader.page(1).text #display pdf text but does not show value in order (in case of table)

displayметод печатает только то, что не возвращает.

если вы хотите увидеть какой-либо результат. введите putsили p и попробуйте

person samslow    schedule 12.07.2019