У меня есть большой массив данных, называемый данными с 1 004 490 наблюдениями, и я хочу проанализировать успех лечения.
ID POSITIONS TREATMENT
1 0 A
1 1 A
1 2 B
2 0 C
2 1 D
3 0 B
3 1 B
3 2 C
3 3 A
3 4 A
3 5 B
Итак, во-первых, я хочу подсчитать, сколько раз одно лечение применялось к пациенту (ID), но одно лечение может быть назначено iD несколько раз. Итак, мне нужно сначала удалить все дубликаты и после подсчета или есть функция, которая не учитывает все дубликаты.
What I want to have :
A : 2
B : 2
C : 2
D : 1
Затем я хочу знать, сколько раз лечение проводилось в последней позиции, но последняя позиция всегда отличается в зависимости от идентификатора.
What I want to have :
A : 0
B : 2 (for ID = 1 and 3)
C : 0
D : 1 (for ID = 1)
Спасибо за вашу помощь, я новый пользователь R!
colSums(table(unique(df1[-2])))
- person akrun   schedule 07.08.2017