Рассмотрим этот фрейм данных:
dfgg
Out[305]:
Parts_needed output
Year Month PartId
2018 1 L27849 72 72
2 L27849 75 147
3 L27849 101 248
4 L27849 103 351
5 L27849 77
6 L27849 120
7 L27849 59
8 L27849 79
9 L27849 28
10 L27849 64
11 L27849 511
12 L27849 34
2019 1 L27849 49
2 L27849 68
3 L27849 75
4 L27849 45
5 L27849 84
6 L27849 42
7 L27849 40
8 L27849 52
9 L27849 106
10 L27849 75
11 L27849 176
12 L27849 58 2193
2020 1 L27849 135 2328
2 L27849 45 2301
3 L27849 21 2247
4 L27849 35
5 L27849 17
6 L27849 39
...
2025 7 L27849 94
8 L27849 13
9 L27849 94
10 L27849 65
11 L27849 141
12 L27849 34
2026 1 L27849 22
2 L27849 132
3 L27849 49
4 L27849 33
5 L27849 48
6 L27849 53
7 L27849 103
8 L27849 122
9 L27849 171
10 L27849 182
11 L27849 68
12 L27849 23
2027 1 L27849 44
2 L27849 21
3 L27849 52
4 L27849 53
5 L27849 57
6 L27849 187
7 L27849 69
8 L27849 97
9 L27849 31
10 L27849 29
11 L27849 33
12 L27849 8
В этом фрейме данных мне нужно получить совокупную сумму Parts_needed с интервалом в 2 года. Например: for 1-2018, 72
будет продолжать добавляться в следующие строки от 75,101,103..
до 1-2020 135
. Аналогично, в 2-2018, 75
будут добавляться следующие строки с 101,103..
по 2-2020 45
. Однако за последние 2 года совокупная сумма будет по всем оставшимся строкам. Я не могу установить диапазон с помощью np.cumsum (). Кто-нибудь может мне помочь?
изменить: я отредактировал, чтобы включить ожидаемый результат. Для 2-2020 вывод будет 2328 + 45-72 (поскольку 72 добавлено на 2 года) Для 3-2020 вывод будет 2301 + 21-75 (поскольку 75 было добавлено на 2 года) и так далее.