Я использую Scalding с Spyglass для чтения/записи в HBase.
Я делаю левое внешнее соединение таблицы1 и таблицы2 и пишу обратно в таблицу1 после преобразования столбца. И table1, и table2 объявлены как Spyglass HBaseSource.
Это прекрасно работает. Но мне нужно получить доступ к другой строке в таблице 1, используя rowkey для вычисления преобразованного значения.
Я попробовал следующее для получения HBase:
val hTable = new HTable(conf, TABLE_NAME)
val result = hTable.get(new Get(rowKey.getBytes()))
Я получаю доступ к заданию «Конфигурация в Scalding», как указано в этой ссылке:
https://github.com/twitter/scalding/wiki/Частозадаваемыевопросы#how-do-i-access-the-jobconf
Это работает, когда я запускаю ошпаривание локально. Но когда я запускаю его в кластере, conf имеет значение null, когда этот код выполняется в Reducer.
Есть ли лучший способ получить/сканировать HBase в задании Scalding/Cascading для таких случаев?