Анализ текста в фрейме данных в r

Я работаю над метаданными Google Store и использую их как фрейм данных. Для каждого приложения есть информация о запрошенных разрешениях в одной ячейке в виде длинного текста, например:

ПРОЧИТАЙТЕ КОНФИДЕНЦИАЛЬНЫЕ ДАННЫЕ ЖУРНАЛА|ПОЛУЧИТЕ ЗАПУСКАЕМЫЕ ПРИЛОЖЕНИЯ|НАЙТИ АККАУНТ НА УСТРОЙСТВЕ|ПРОЧИТАЙТЕ СВОЮ СОБСТВЕННУЮ КОНТАКТНУЮ КАРТОЧКУ|ПРОЧИТАЙТЕ СВОИ КОНТАКТЫ|

Я хочу разделить текст между "|" в разные ячейки (столбцы), чтобы я мог анализировать существующие разрешения. Раньше я не анализировал текст с помощью R. Я пытался использовать строковые функции, однако при просмотре информации в ячейке она не распознавалась как строка.

Есть предложения, направления? Спасибо!

r text-analysis

Oshrat 21.08.2016 источник

Ответы (1)

arrow_upward
1
arrow_downward

Вы можете сделать что-то вроде этого: Пример строки -

strin1 <- "READ SENSITIVE LOG DATA|RETRIEVE RUNNING APPS|FIND ACCOUNTS ON THE DEVICE|READ YOUR OWN CONTACT CARD|READ YOUR CONTACTS|"

read.table(text = strin1, sep ='|', colClasses = character)

Делает трюк.

Лучшим решением является использование пакета tidyr в этом ответе: >Разделение строкового столбца фрейма данных на несколько разных столбцов

Pj_ 21.08.2016

comment

Спасибо! функция cSplit из пакета splitstackshape сработала :) - Oshrat; 21.08.2016

Анализ текста в фрейме данных в r

Ответы (1)

Вопросы по теме