Я хочу прочитать кучу файлов CSV. Этот (movies_user.cleaned.csv), например, содержит 2 переменные: uid (идентификатор пользователя) и movie_name. Поскольку SAS считывает только первые 20 строк для определения длины строки, мои данные усекаются. («Гарри Поттер» часто меняется на «Гарри Пот» и так далее.)
Я знаю, что могу использовать в своем коде Guangingrows=32767 (32767 — это максимум, который можно использовать), чтобы позволить SAS проверить первые 32767 строк, но я не думаю, что это достаточно безопасно, чтобы гарантировать отсутствие усечения. Некоторые из моих CSV намного больше этого.
Вот код, который я использую:
proc import datafile="H:\FBDATA_CLEANED\facebookdata2\movies_user.cleaned.csv"
out=thesis.activities2
dbms=csv
replace;
getnames=yes;
run;
Ребята, вы можете мне немного помочь? Спасибо!