Я пытаюсь прочитать очень большой файл .csv в R
OrigTotalPumping <- read.table("/Users/Larry/Desktop/OrigTotalPumping/MasterOrigFt3.csv",
header=F, sep=",")
Я получаю сообщение об ошибке
Ошибка при сканировании (файл, что, nmax, sep, dec, quote, skip, nlines, na.strings,: строка 19437 не содержит 7 элементов
Поэтому я попытался просто пропустить эту строку, но та же ошибка возникает для нескольких строк в файле, а файл слишком велик для открытия и исправления вручную. Например
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 2 did not have 7 elements
а также
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
line 19439 did not have 7 elements
Как мне настроить его так, чтобы он мог читать этот файл, несмотря на эту проблему?
scan("MasterOrigFt3.csv", "character", skip=19436, n=1, sep="\n")
- person MrFlick   schedule 13.07.2014scan
просто плохую строчку. У R не должно возникнуть проблем с этим. Точно так же вы можете назначить все плохие строки дляbaddies
с помощьюtxt <- readLines("/Users/Larry/Desktop/OrigTotalPumping/MasterOrigFt3.csv"); baddies <- txt[which(count.fields(textConnection(txt), ',') != 7]
. - person jbaums   schedule 13.07.2014txt <- readLines("/Users/Larry/Desktop/OrigTotalPumping/MasterOrigFt3.csv"); OrigTotalPumping <- read.csv(text=txt[which(count.fields(textConnection(txt), ',') == 7)], header=FALSE)
(Это исправляет опечатку из моего предыдущего, теперь удаленного комментария). - person jbaums   schedule 13.07.2014,quote = ""
вread.table()
. Это то, что обычно вызывает подобные ошибки. - person David Arenburg   schedule 13.07.2014#
или'
? Это можно исправить, задав параметрыquote=
илиcomment=
. - person MrFlick   schedule 13.07.2014