Я работаю с Apache Accumulo, и мне нужно создать итератор, который при каждом незначительном уплотнении сканирует всю строку целиком, создает MD5 из двух столбцов и сохраняет его как еще один столбец моей строки...
Пример:
Я вставляю эти данные:
|| Row || colFam || colQual || value ||
||=====||========||=========||=======||
|| A || person || name || Bob ||
|| A || person || surname || Smith ||
|| A || work || place || Bank ||
|| B || person || name || Jhon ||
|| B || person || surname || Allen ||
|| B || work || place || Pub ||
...
...
Мне нужен итератор, который каждый раз, когда я пишу строку (A или B со всеми ее colFam e colQual), получает значение двух столбцов (имя и фамилия) и вычисляет MD5 результирующей строки (имя + фамилия) и сохраняет ее как столбец моей строки.
Результат должен быть таким:
|| Row || colFam || colQual || value ||
||=====||========||=========||==============||
|| A || person || name || Bob ||
|| A || person || surname || Smith ||
|| A || work || place || Bank ||
|| A || MD5 || MD5 || <MD5 result> || <--
|| B || person || name || Jhon ||
|| B || person || surname || Allen ||
|| B || work || place || Pub ||
|| B || MD5 || MD5 || <MD5 result> || <--
....
....
Я думаю, что я могу поставить этот итератор на незначительное (/большое) уплотнение таблицы.
Есть идеи? Какой из встроенных итераторов мне нужно расширить для этого?
Большое спасибо