Вопросы по теме 'lzo'
Есть ли источник Scalding, который я могу использовать для lzo-сжатых двоичных данных?
Я записываю сериализованные записи Thrift в файл, используя сжатие LZO Elephant Bird . Для этого я использую их класс ThriftBlockWriter . Затем в моем задании Scalding используется FixedPathLzoThrift для обработки записей. Все работает...
369 просмотров
schedule
28.09.2021
Spark/Hadoop выдает исключение для больших файлов LZO
Я запускаю задание EMR Spark для некоторых сжатых LZO файлов журналов, хранящихся в S3. В одной папке хранится несколько лог-файлов, например:
...
s3://mylogfiles/2014-08-11-00111.lzo
s3://mylogfiles/2014-08-11-00112.lzo
...
В искровой...
3830 просмотров
schedule
13.03.2022
Hadoop lzo одиночный разделитель после индекса
У меня есть сжатый LZO-файл /data/mydata.lzo , и я хочу запустить его, используя некоторый код MapReduce, который у меня есть. Сначала я создаю файл индекса с помощью пакета hadoop-lzo со следующей командой:
>> hadoop jar...
266 просмотров
schedule
23.04.2022
Массив Int и *Char — C++
Я хочу использовать LZO для сжатия массива целых чисел или байтов. Поэтому мне нужно скопировать массив int в * char, затем я сожму и сохраню в файл. И после того, как мне нужно сделать обратную операцию. Я открою файл, прочитаю его с помощью *Char...
335 просмотров
schedule
13.09.2022
Как записать в hadoop hdfs с помощью сжатия lzo без уменьшения карты
Пишу в hadoop hdfs. Файл необходимо сжать с помощью lzo. Также файл будет добавлен в реальном времени.
Исходный файл - это файл gzip, которого нет в hadoop. Пакет обрабатывает этот файл gzip, а затем выполняет сжатие lzo и добавляет его в файл...
4922 просмотров
schedule
15.12.2022
Как распаковать сжатый массив байтов lzo в java?
Я новичок в сжатии и распаковке LZO. Я пытаюсь использовать эту библиотеку lzo-java .
Вводная информация:
У меня есть один байтовый массив в сжатом формате. Этот массив байтов я хочу распаковать, и, наконец, мне нужен распакованный массив...
481 просмотров
schedule
20.05.2023
Как я могу получить размер файла, сжатого в файле lzo, без его распаковки?
Я хочу получить размер файла, сжатого в файлах lzo в hdfs, но я не хочу распаковывать файл. Файл очень большой, долго загружается на мой ПК.
125 просмотров
schedule
07.03.2024
библиотека native-lzo недоступна на узлах данных Hadoop
Я написал простой LzoWordCount в свой Gateway/hadoop-env.sh:
HADOOP_CLASSPATH=/opt/cloudera/parcels/HADOOP_LZO/lib/hadoop/lib/hadoop-lzo-cdh4-0.4.15-gplextras.jar...
7752 просмотров
schedule
23.05.2024