Я здесь новенький, поэтому я надеюсь помочь вам, и мне помогут, если это будет возможно.
Я сделал проект Apache Spark, используя Spark SQL и ML Spark на Java. Я закончил этот проект, но у меня проблемы с выводом.
У меня есть Dataset<Row>
final (final - это имя набора данных) с некоторой информацией. Когда я использую show()
с этим набором данных (finals.show();
), я получаю следующую информацию:
[2018026,1,9.93,127.66,5.16,245.8,4.426875,6.91]
[2018026,1,9.97,127.89,5.36,244.8,4.426875,6.91]
[2018026,1,6.76,113.54,6.42,228.8,4.426875,6.91]
[2018026,1,6.92,114.2,6.81,224.0,4.426875,6.91]
[2018026,1,6.86,113.98,6.65,226.0,4.426875,6.91]
[2018026,1,6.81,113.76,6.58,227.4,4.426875,6.91]
[2018026,1,6.97,113.49,6.58,225.8,4.426875,6.91]
[2018026,1,6.97,114.42,6.67,221.6,4.426875,6.91]
(«,» - это разделитель между полями). Ну, я пытаюсь получить этот вывод в текстовом файле, например projectSpark.txt, но для меня это невозможно. Как я могу получить эту информацию в текстовом файле? Должен ли я перебирать Dataset<Row>
или есть какие-то методы для этого?
Большое спасибо, ребята.
С Уважением.
DataSet
имеет методtoDF
, который преобразует его в общий фрейм данных. После этого, как говорили другие, легко записатьDataFrame
в файл, см. Пример здесь: community.hortonworks.com/questions/46772/ - person agiro   schedule 25.09.2018finals.javaRDD().map(x -> x.toString()).saveAsTextFile("your/path");
- person Álvaro Valencia   schedule 25.09.2018coalesce(1)
для разделения в одном разделе:finals.javaRDD().map(x -> x.toString()).coalesce(1).saveAsTextFile("your/path");
- person Álvaro Valencia   schedule 25.09.2018