Вопросы по теме 'sequencefile'
Получить путь к файлу HDFS в PySpark для файлов в формате файла последовательности
Мои данные о HDFS находятся в формате файла Sequence. Я использую PySpark (Spark 1.6) и пытаюсь достичь двух вещей:
Путь к данным содержит метку времени в формате гггг / мм / дд / чч, которую я хотел бы добавить в сами данные. Я пробовал...
3986 просмотров
schedule
05.11.2021
Как обработать этот текст блок за блоком?
Я хочу обрабатывать данные по блокам отдельно
Вот текст:
[Глобальный] asd dsa akl ASd
[Тест2] bnmnb hkhjk Цуци Цуци Цитци [Тест3] 5675 46546 464 564 56456 45645654 4565464 [другое] sdfsd dsf sdf dsfs И сначала я хочу первый блок и...
73 просмотров
schedule
18.04.2022
Файлы последовательности FileNotFoundException Mahout
Я читаю Поваренную книгу Apache Mahout . Но у меня есть проблема в главе 2, создание файла последовательности. Я использую Mahout 0.9
Команда, которую я выполняю, выглядит следующим образом:
$MAHOUT_HOME/bin/mahout seqdirectory -i...
385 просмотров
schedule
23.06.2022
Возвращаемое значение процедуры 'show' последовательности ядра Linux
Я пытаюсь понять файлы последовательности в ядре Linux. ИМХО, они довольно непонятые звери, и с учетом этого я скомпилировал готовый модуль ядра из веб . Я воспроизвожу (измененный) код здесь для простоты доступа:
#include...
203 просмотров
schedule
08.07.2022
Как скопировать вывод команды -text HDFS в другой файл?
Есть ли способ скопировать текстовое содержимое файла hdfs в другую файловую систему с помощью команды HDFS:
hadoop fs -text /user/dir1/abc.txt
Могу ли я распечатать вывод -text в другой файл, используя -cat или любой другой метод?:...
7390 просмотров
schedule
03.10.2022
Mahout: невозможно преобразовать в файл последовательности
Я пытаюсь преобразовать некоторые текстовые файлы в файлы последовательности mahout. Так что я делаю
mahout seqdirectory -i inputFolder -o outputFolder
Но я всегда получаю это исключение
java.lang.Exception: java.lang.RuntimeException:...
1034 просмотров
schedule
22.04.2023
Hadoop mapreduce: java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy()Z
Я пытаюсь написать файл сжатой последовательности мгновенных блоков из задания уменьшения карты. Я использую hadoop 2.0.0-cdh4.5.0 и snappy-java 1.0.4.1.
Вот мой код:
package jinvestor.jhouse.mr;
import java.io.ByteArrayOutputStream;
import...
25408 просмотров
schedule
01.11.2022
Hadoop добавляется в Sequencefile
В настоящее время я использую следующий код для добавления к существующему файлу SequenceFile :
// initialize sequence writer
Writer writer = SequenceFile.createWriter(
FileContext.getFileContext(this.conf),
this.conf,...
1858 просмотров
schedule
08.07.2023
Почему операция добавления модуля записи SequenceFile перезаписывает все значения последним значением?
Во-первых, рассмотрим этот класс CustomWriter:
public final class CustomWriter {
private final SequenceFile.Writer writer;
CustomWriter(Configuration configuration, Path outputPath) throws IOException {
FileSystem fileSystem =...
383 просмотров
schedule
19.03.2023
невозможно создать кадр данных из файла последовательности в Spark, созданного Sqoop
Я хочу прочитать данные orders и создать из них RDD, который хранится в виде файла sequence в Hadoop fs в cloudera vm . Ниже приведены мои шаги:
1) Импорт данных заказов в виде файла последовательности:
sqoop import --connect...
1235 просмотров
schedule
24.02.2024