Вопросы по теме 'sequencefile'

Получить путь к файлу HDFS в PySpark для файлов в формате файла последовательности
Мои данные о HDFS находятся в формате файла Sequence. Я использую PySpark (Spark 1.6) и пытаюсь достичь двух вещей: Путь к данным содержит метку времени в формате гггг / мм / дд / чч, которую я хотел бы добавить в сами данные. Я пробовал...
3986 просмотров
schedule 05.11.2021

Как обработать этот текст блок за блоком?
Я хочу обрабатывать данные по блокам отдельно Вот текст: [Глобальный] asd dsa akl ASd [Тест2] bnmnb hkhjk Цуци Цуци Цитци [Тест3] 5675 46546 464 564 56456 45645654 4565464 [другое] sdfsd dsf sdf dsfs И сначала я хочу первый блок и...
73 просмотров
schedule 18.04.2022

Файлы последовательности FileNotFoundException Mahout
Я читаю Поваренную книгу Apache Mahout . Но у меня есть проблема в главе 2, создание файла последовательности. Я использую Mahout 0.9 Команда, которую я выполняю, выглядит следующим образом: $MAHOUT_HOME/bin/mahout seqdirectory -i...
385 просмотров
schedule 23.06.2022

Возвращаемое значение процедуры 'show' последовательности ядра Linux
Я пытаюсь понять файлы последовательности в ядре Linux. ИМХО, они довольно непонятые звери, и с учетом этого я скомпилировал готовый модуль ядра из веб . Я воспроизвожу (измененный) код здесь для простоты доступа: #include...
203 просмотров

Как скопировать вывод команды -text HDFS в другой файл?
Есть ли способ скопировать текстовое содержимое файла hdfs в другую файловую систему с помощью команды HDFS: hadoop fs -text /user/dir1/abc.txt Могу ли я распечатать вывод -text в другой файл, используя -cat или любой другой метод?:...
7390 просмотров
schedule 03.10.2022

Mahout: невозможно преобразовать в файл последовательности
Я пытаюсь преобразовать некоторые текстовые файлы в файлы последовательности mahout. Так что я делаю mahout seqdirectory -i inputFolder -o outputFolder Но я всегда получаю это исключение java.lang.Exception: java.lang.RuntimeException:...
1034 просмотров
schedule 22.04.2023

Hadoop mapreduce: java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy()Z
Я пытаюсь написать файл сжатой последовательности мгновенных блоков из задания уменьшения карты. Я использую hadoop 2.0.0-cdh4.5.0 и snappy-java 1.0.4.1. Вот мой код: package jinvestor.jhouse.mr; import java.io.ByteArrayOutputStream; import...
25408 просмотров
schedule 01.11.2022

Hadoop добавляется в Sequencefile
В настоящее время я использую следующий код для добавления к существующему файлу SequenceFile : // initialize sequence writer Writer writer = SequenceFile.createWriter( FileContext.getFileContext(this.conf), this.conf,...
1858 просмотров
schedule 08.07.2023

Почему операция добавления модуля записи SequenceFile перезаписывает все значения последним значением?
Во-первых, рассмотрим этот класс CustomWriter: public final class CustomWriter { private final SequenceFile.Writer writer; CustomWriter(Configuration configuration, Path outputPath) throws IOException { FileSystem fileSystem =...
383 просмотров
schedule 19.03.2023

невозможно создать кадр данных из файла последовательности в Spark, созданного Sqoop
Я хочу прочитать данные orders и создать из них RDD, который хранится в виде файла sequence в Hadoop fs в cloudera vm . Ниже приведены мои шаги: 1) Импорт данных заказов в виде файла последовательности: sqoop import --connect...
1235 просмотров