Анализ текста в фрейме данных в r

Я работаю над метаданными Google Store и использую их как фрейм данных. Для каждого приложения есть информация о запрошенных разрешениях в одной ячейке в виде длинного текста, например:

ПРОЧИТАЙТЕ КОНФИДЕНЦИАЛЬНЫЕ ДАННЫЕ ЖУРНАЛА|ПОЛУЧИТЕ ЗАПУСКАЕМЫЕ ПРИЛОЖЕНИЯ|НАЙТИ АККАУНТ НА ​​УСТРОЙСТВЕ|ПРОЧИТАЙТЕ СВОЮ СОБСТВЕННУЮ КОНТАКТНУЮ КАРТОЧКУ|ПРОЧИТАЙТЕ СВОИ КОНТАКТЫ|

Я хочу разделить текст между "|" в разные ячейки (столбцы), чтобы я мог анализировать существующие разрешения. Раньше я не анализировал текст с помощью R. Я пытался использовать строковые функции, однако при просмотре информации в ячейке она не распознавалась как строка.

Есть предложения, направления? Спасибо!


person Oshrat    schedule 21.08.2016    source источник


Ответы (1)


Вы можете сделать что-то вроде этого: Пример строки -

strin1 <- "READ SENSITIVE LOG DATA|RETRIEVE RUNNING APPS|FIND ACCOUNTS ON THE DEVICE|READ YOUR OWN CONTACT CARD|READ YOUR CONTACTS|"

read.table(text = strin1, sep ='|', colClasses = character)

Делает трюк.

Лучшим решением является использование пакета tidyr в этом ответе: >Разделение строкового столбца фрейма данных на несколько разных столбцов

person Pj_    schedule 21.08.2016
comment
Спасибо! функция cSplit из пакета splitstackshape сработала :) - person Oshrat; 21.08.2016