У меня проблема с чтением большого файла (около 2000000 строк) с помощью пакета readr.
Почему я хочу использовать пакет readr. Мой файл данных может содержать управляющие символы ASCII (0x01, равный ascii 26, равный CTRL + Z), который останавливает выполнение read.table()
, и я отмечаю, что пакет readr
не чувствителен к этой проблеме.
У моего файла разные длины строк, поэтому я бы использовал fill=TRUE
, если бы мог использовать read.table()
.
Я попытался использовать read_table
пакета readr, но безуспешно, потому что он, похоже, не находил пробелы в качестве разделителя столбцов.
Пробовал использовать read_delim
. с кодом read_delim(file,delim=" ")
. Разделитель был найден, но первая строка считается основной длиной моего фрейма данных, и поэтому строки с большей длиной были усечены.
Есть ли у кого-нибудь совет?
fread
функцию вdata.table
пакете? - person Jaap   schedule 12.05.2016read_file()
? Эти функции были созданы именно для того, чтобы читать текстовый файл, в котором столбцы разделены пробелами < / а>. Думая об альтернативе, знаете ли выwidth
каждого столбца? или колонка начальная и конечная позиции? - person rafa.pereira   schedule 12.05.2016blank.lines.skip = TRUE
, см.?fread
для получения информации обо всех параметрах. - person Jaap   schedule 12.05.2016read_delim(file,delim="")
? Обратите внимание, я удалил пробел между кавычками. - person rafa.pereira   schedule 13.05.2016