Я записываю сериализованные записи Thrift в файл, используя сжатие LZO Elephant Bird. Для этого я использую их класс ThriftBlockWriter
. Затем в моем задании Scalding используется FixedPathLzoThrift для обработки записей. Все работает нормально. Проблема в том, что я ограничен записями одного класса Thrift.
Я хочу начать использовать RawBlockWriter
вместо ThriftBlockWriter[MyThriftClass]
. Поэтому вместо записей Thrift, сжатых с помощью LZO, я буду вводить необработанные массивы байтов с LZO-сжатием. У меня вопрос: что использовать вместо FixedPathLzoThrift[MyThriftClass]
?
Объяснение тега "protocol-buffers": Elephant Bird использует класс Protocol Buffers SerializedBlock
для обертывания необработанного ввода, как показано на здесь.