У меня есть таблица Impala, которую я хотел бы запросить с помощью Ibis. Таблица выглядит следующим образом:
id | timestamp
-------------------
A | 5
A | 7
A | 3
B | 9
B | 5
Я хочу group_by
изменить эту таблицу в соответствии с уникальными комбинациями id
и timestamp range
. В конечном итоге операция группировки должна создать один grouped
объект, к которому я затем могу применить агрегирование. Например:
условия группы1: id == A; 4 < timestamp < 11
условия группы2: id == A; 1 < timestamp < 6
условия группы3: id == B; 4 < timestamp < 7
с получением объекта grouped
со следующими группами:
группа 1:
id | timestamp
-------------------
A | 5
A | 7
группа2:
id | timestamp
-------------------
A | 5
A | 3
group3:
id | timestamp
-------------------
B | 5
Когда у меня будут группы, я проведу различные агрегаты, чтобы получить окончательные результаты. Если бы кто-нибудь мог помочь мне разобраться в этом group_by, я был бы очень признателен, даже регулярное выражение pandas было бы полезным!