Я «загрузил» N файлов из определенного каталога в один RDD
val data = sc.textFile("file:///myPath/*.txt")
Например, мои 2 файла содержат по 5 строк каждый.
Файл 1
A
B
C
D
E
Файл 2
F
G
H
I
J
Если я добавлю sortBy в свой код:
val sortedData = data.sortBy(x => x)
Я не получаю отсортированные данные, а просто случайный RDD:
J
B
C
E
A
D
G
F
H
I
Сбор мог бы помочь мне, но
1) это не идеально для больших RDD
2) вместо RDD он возвращает массив (который я должен повторно распараллелить)
заранее спасибо
FF