datastax-предприятие
датастакс-стартап
Мы используем кластер DataStax DSE.
Мы пытаемся перенести таблицу в другую таблицу с тем же определением, что и первая таблица, но со вторичным индексом.
Он имеет около 1,7 млн строк
1) Сначала мы используем команду Cassandra COPY из cqlsh. Это занимает много времени > 1 часа. Тайм-аут, не сработало 2) Затем мы пишем программу для экспорта 1-й таблицы в файл CSV. Разбиваем этот CSV-файл на отдельные CSV-файлы и пытаемся загрузить его против 2-й таблицы.
Вставка занимает некоторое время, и она терпит неудачу
3) Мы изучаем http://www.datastax.com/dev/blog/using-the-cassandra-bulk-loader-updated
Поскольку у нас есть CSV-файл, правильный ли это подход?
И мы используем эту библиотеку https://github.com/yukim/cassandra-bulkload-example для создания файла SSTABLE.
Это правильный способ справиться с этим?