Вопросы по теме 'plyr'

Циклы R: добавление столбца в таблицу, если он еще не существует
Я пытаюсь скомпилировать данные из нескольких файлов, используя циклы for в R. Я хочу собрать все данные в одну таблицу. Следующий расчет является лишь примером. library(reshape) dat1 <- data.frame("Specimen" = paste("sp", 1:10, sep=""),...
2996 просмотров
schedule 03.10.2021

Интерполировать переменные в подмножествах фрейма данных
У меня есть большой фрейм данных, в котором есть наблюдения из опросов, проведенных в разных штатах за несколько лет. Вот структура данных: state | survey.year | time1 | obs1 | time2 | obs2 CA | 2000 | 1 | 23 | 1.2 | 43 CA |...
598 просмотров
schedule 19.09.2021

R - Ускорение приблизительного совпадения даты. idata.frame?
Я изо всех сил пытаюсь эффективно выполнить «близкое» совпадение даты между двумя фреймами данных. В этом вопросе рассматривается решение с использованием idata.frame из пакета plyr , но я был бы очень доволен и другими предлагаемыми решениями....
2285 просмотров
schedule 14.10.2021

использование нескольких переменных в plyr
Я пытаюсь использовать plyr, но испытываю трудности с использованием нескольких переменных. Вот пример. df <- read.table(header=TRUE, text=" Firm Foreign SME Turnover A1 N Y 200 A2 N N 1000 A3 Y Y...
400 просмотров
schedule 08.11.2021

Медиана столбца, а затем поиск другого значения столбца? (Р)
У меня есть такая таблица: Profession Educational_level Number Doctor Low 0 Doctor Medium 5 Doctor High 8 Nurse Low 1 Nurse Medium 8 Nurse High...
254 просмотров
schedule 05.11.2021

Транспонирование фрейма данных
У меня вопрос о преобразовании (если это правильное слово) фрейма данных в его транспонированную версию. Хочу взять что-то вроде: A B C 1 6 1 1 18 1 1 21 1 3 18 1 3 21 1 4 6 1 4 18 1 4 20 1 4 21 1 И...
189 просмотров
schedule 21.10.2021

ddply резюмировать по нескольким переменным
Я вижу, что ddply прекрасно суммирует и группирует по переменным. Я хочу, чтобы ddply просканировал очень большой фрейм данных только один раз и предоставил мне количество (длину) для более чем одной переменной. Как это может быть сделано?...
9311 просмотров
schedule 08.09.2021

Сводная функция R в ddply (plyr) простым способом
Как мне воспроизвести это с plyr ? with(mtcars, tapply(mpg, cyl, summary)) С такой же элегантностью, то есть без подробного описания отдельных статистических данных?
2336 просмотров
schedule 17.10.2021

Как подсчитать все уникальные значения в data.frame
У меня есть набор данных с диагнозами в качестве переменных и пациентами в качестве наблюдений. Это 32 переменных и 5000 наблюдений. Взгляните на этот пример. Моя цель - подсчитать и суммировать все диагнозы во фрейме данных. set.seed(1)...
1539 просмотров
schedule 21.10.2021

Извлечение данных из другого фрейма data.frame с помощью dplyr?
У меня есть фрейм данных под названием dat_new, по сути, это данные о посещении клиники, hrn - это идентификатор пациента, а dov - дата посещения (несколько посещений на человека). Затем у меня есть фрейм данных, называемый событием, с датой...
3996 просмотров
schedule 16.09.2021

Новая переменная на основе условной арифметики по группам
У меня есть data.frame df , где я хочу создать новую переменную, которая является долей другой по группе. То есть для каждого Species ID Plot Sub разделения я хотел бы найти пропорцию Area на Type . Если Type = 0, то PropArea == 1,...
80 просмотров
schedule 18.09.2021

Как заставить Зелига работать со списками
Я хочу взять список сопоставленных наборов данных (где наблюдения сопоставляются по их оценкам склонности, используя MatchIt Package ) для последующего моделирования в пакете Zelig . В этом примере я буду сравнивать две процедуры ( t1 и t2 ),...
146 просмотров
schedule 11.11.2021

как использовать aaply и сохранить порядок размеров в массиве?
У меня есть массив с 3 измерениями. Я хотел бы применить функцию к 3-му измерению и вернуть массив. Мне было очень приятно, что plyr :: aaply делает почти то, что я хочу. Однако он меняет размеры моего массива. В документации мне говорилось, что...
422 просмотров
schedule 24.11.2021

Cumsum с plyr ddply не работает
Я пытаюсь использовать cumsum с ddply plyr , чтобы получить промежуточный итог. Однако я просто не понимаю, почему это не работает. n = c(2, 3, 5) s = c("aa", "bb", "cc") dd = data.frame(n, s) # n s # 1 2 aa # 2 3 bb # 3 5 cc test...
680 просмотров
schedule 13.11.2021

Нахождение частот всех возможных пар в R
Я работаю с большим набором данных о лекарствах и реакциях, используя R. На данный момент у меня есть данные, структурированные как очень высокий фрейм данных, в котором перечислены идентификационный номер отчета, название лекарства и сообщенные...
898 просмотров
schedule 04.10.2021

создание индекса, обусловленного значением в другом столбце; различия с течением времени
Я борюсь со следующей проблемой: фрейм данных ниже содержит изменение значения с течением времени для различных идентификаторов. Я пытаюсь получить увеличение / уменьшение этих значений на основе значения за год, когда произошло событие. В пределах...
127 просмотров
schedule 06.11.2021

Реструктуризация подмножества данных R
Я новичок в R / Rstudio и все еще учусь выполнять определенные операции. У меня есть следующий набор данных. Для столбцов у меня есть рабочий регион, тип элемента (CA, OBU), подэлемент и чистый доход. В настоящее время данные довольно большие (50...
87 просмотров
schedule 07.09.2021

Отсортируйте по году, затем подсчитайте фиктивные переменные для каждого округа (ddply)
Я создаю сводную таблицу для документа о репликации, и у меня возникают проблемы с ее выполнением с помощью ddply. Мне нужно отсортировать по годам, а затем подсчитать, сколько округов (fips) имеет фиктивную переменную == 1 (RVPI == 1) за каждый...
120 просмотров
schedule 24.10.2021

подмножество df с повторяющимися последовательностями
Я много и мало искал решение этой проблемы, но не могу найти его ... В моем фреймворке данных (по сути, это таблица спортивной команды №1 по дате) было множество случаев, когда одна или несколько команд «снова появлялись» в данных. Я хочу вытащить...
103 просмотров
schedule 29.10.2021

нормализовать все данные к одному гену (наблюдение) в r
У меня есть некоторые данные об экспрессии белков для 850 белков, и я хотел бы нормализовать эти данные для эталонного белка. Это хороший способ исправить технические ошибки. Я новичок в R и только что решил создать аккуратный набор данных. Но...
101 просмотров
schedule 16.11.2021