Использование compare.linkage из R для сравнения двух фреймов данных и создания пар для входных данных

Я пытаюсь ввести некоторые данные в свой набор данных на основе другого. Однако для этого мне нужно сравнить несколько переменных, и каждая из них имеет вес. Кроме того, мне нужно сформировать пары, используя переменные KEY, которые являются идентификатором в моих данных.

Я пытался использовать compare.linkage, но не смог найти способ вставить веса, которые мне нужны, например, 40% для Age, 40% для CHBORN и 20% для URBAN.

Complete <- data.frame(KEY = c(001, 002, 003), AGE = c(35, 38, 45), CHBORN = c(2, 3, 4), URBAN = c(1, 2, 2))

incomplete <- data.frame(KEY = c(004, 005, 006), AGE = c(25, 38, 45), CHBORN = c(1, 2, 4), URBAN = c(2, 1, 1))

KEY_Pairs <- compare.linkage(incomplete, complete, blockfld = c(2, 3, 4), strcmp = TRUE, strcmpfun = levenshteinSim()) #I stopped here

Я хочу найти результат, подобный этому:

KEY_incomplete KEY_complete Scores   
  004             001        0.95

Обычно я делаю это с помощью программы FRIL от Университета Эмори, но я стараюсь сконцентрировать все в R.

Лучший,

Тереза


person Tereza Bernardes    schedule 05.03.2019    source источник
comment
из какого пакета compare.linkage?   -  person Dave Gruenewald    schedule 05.03.2019


Ответы (1)


Пакет RecordLinkage: https://cran.r-project.org/web/packages/RecordLinkage/RecordLinkage.pdf

person Tereza Bernardes    schedule 06.03.2019