Я пытаюсь ввести некоторые данные в свой набор данных на основе другого. Однако для этого мне нужно сравнить несколько переменных, и каждая из них имеет вес. Кроме того, мне нужно сформировать пары, используя переменные KEY, которые являются идентификатором в моих данных.
Я пытался использовать compare.linkage
, но не смог найти способ вставить веса, которые мне нужны, например, 40% для Age
, 40% для CHBORN
и 20% для URBAN
.
Complete <- data.frame(KEY = c(001, 002, 003), AGE = c(35, 38, 45), CHBORN = c(2, 3, 4), URBAN = c(1, 2, 2))
incomplete <- data.frame(KEY = c(004, 005, 006), AGE = c(25, 38, 45), CHBORN = c(1, 2, 4), URBAN = c(2, 1, 1))
KEY_Pairs <- compare.linkage(incomplete, complete, blockfld = c(2, 3, 4), strcmp = TRUE, strcmpfun = levenshteinSim()) #I stopped here
Я хочу найти результат, подобный этому:
KEY_incomplete KEY_complete Scores
004 001 0.95
Обычно я делаю это с помощью программы FRIL от Университета Эмори, но я стараюсь сконцентрировать все в R
.
Лучший,
Тереза
compare.linkage
? - person Dave Gruenewald   schedule 05.03.2019