Сопоставьте два списка в R, один с частичными строками, а другой с полной строкой, верните всю строку, если совпадают. Возвращать только уникальные совпадения (один раз).
Итак, допустим, у меня есть файл CSV, и каждая строка имеет длинную строку (длинный список). Затем я сокращаю строку, используя substr, а затем удаляю все повторяющиеся строки, используя unique. Затем я хочу сравнить длинный список строк df12
с уникальным коротким списком df14
, и если есть уникальные совпадения при частичном поиске строки (df14
против df12
), то вернуть всю строку из df12
.
Это df12
(длинный список строк)
[1] I like stackoverflow very much today
[2] I like stackoverflow much today
[3] I dont like stackoverflow very much today
[4] I dont like you!
[5] What?
df13<-substr(df12, start=0, stop=30)
Это df13
(сокращенные строки - не уникальные)
[1] I like stacko
[2] I like stacko
[3] I dont like s
[4] I dont like y
[5] What?
df14<-unique(df13)
Это df14
(укороченные строки - уникальные строки после применения уникального метода)
[1] I like stacko
[2] I dont like s
[3] I dont like y
[4] What?
Это результат, который я хочу в конце
[1] I like stackoverflow very much today
[2] I dont like stackoverflow very much today
[3] I dont like you!
[4] What?
df13<-substr(df12, start=0, stop=30)
не дает ожидаемого результата для меня. Должно бытьdf13<-substr(df12, start=0, stop=13)
? - person NGaffney   schedule 20.01.2016