У меня есть фрейм данных, состоящий из неуникального идентификатора (ID) и мер некоторых свойств объектов в этом ID, примерно так:
ID Sph
A 1.0
A 1.2
A 1.1
B 0.5
B 1.8
C 2.2
C 1.1
D 2.1
D 3.0
Во-первых, я получаю количество экземпляров каждого идентификатора как X, используя table(df$ID)
, то есть A=3
, B=2
, C=2
и D=2
. Затем я хотел бы применить порог в категории «Sph» после получения количества экземпляров, ограничиваясь строками, в которых значение Sph
превышает пороговое значение. Например, с порогом 2.0 я бы использовал thold=df[df$Sph>2.0,]
. Наконец, я хотел бы заменить столбец ID
значением X
, которое я вычислил, используя table
выше. Например, с порогом 1,1 в столбцах «Sph» я хотел бы получить следующий результат:
ID Sph
3 1.0
2 1.8
2 2.2
2 2.1
2 3.0
Другими словами, после использования table()
для получения значения x, соответствующего количеству появлений идентификатора, скажем 3, я хотел бы затем присвоить это число каждому значению в этом идентификаторе Y, которое превышает некоторый порог.