У меня есть большой файл (data.txt, 35 ГБ) с 3 столбцами. Примерная часть файла будет выглядеть следующим образом:
... ... ...
5 701565 8679.56
8 1.16201e+006 3193.18
1 1.16173e+006 4457.85
14 1.16173e+006 4457.85
9 1.77942e+006 7208.73
4 1.78011e+006 8239.88
14 1.78019e+006 8195.57
9 2.00206e+006 8858.55
4 2.00199e+006 7924
... ... ...
Я хочу построить гистограмму для 3-го столбца, когда значения во втором столбце находятся в диапазоне от 0 до 50 000.
Затем я хочу сделать еще одну гистограмму, где значения первого столбца находятся в диапазоне от 50 000 до 100 000. И так далее.
Я не знаю, как указать условие для второго столбца с пакетом sqldf, поскольку у меня нет имен столбцов?
Вероятно, должно получиться что-то вроде этого:
sql = "выберите * из файла, где 'column2'> 0 и 'column2'‹ 50000 "
Как я могу выбрать "столбец2"?