Вопросы по теме 'plyr'
Циклы R: добавление столбца в таблицу, если он еще не существует
Я пытаюсь скомпилировать данные из нескольких файлов, используя циклы for в R. Я хочу собрать все данные в одну таблицу. Следующий расчет является лишь примером.
library(reshape)
dat1 <- data.frame("Specimen" = paste("sp", 1:10, sep=""),...
2996 просмотров
schedule
03.10.2021
Интерполировать переменные в подмножествах фрейма данных
У меня есть большой фрейм данных, в котором есть наблюдения из опросов, проведенных в разных штатах за несколько лет. Вот структура данных:
state | survey.year | time1 | obs1 | time2 | obs2
CA | 2000 | 1 | 23 | 1.2 | 43
CA |...
598 просмотров
schedule
19.09.2021
R - Ускорение приблизительного совпадения даты. idata.frame?
Я изо всех сил пытаюсь эффективно выполнить «близкое» совпадение даты между двумя фреймами данных. В этом вопросе рассматривается решение с использованием idata.frame из пакета plyr , но я был бы очень доволен и другими предлагаемыми решениями....
2285 просмотров
schedule
14.10.2021
использование нескольких переменных в plyr
Я пытаюсь использовать plyr, но испытываю трудности с использованием нескольких переменных. Вот пример.
df <- read.table(header=TRUE, text="
Firm Foreign SME Turnover
A1 N Y 200
A2 N N 1000
A3 Y Y...
400 просмотров
schedule
08.11.2021
Медиана столбца, а затем поиск другого значения столбца? (Р)
У меня есть такая таблица:
Profession Educational_level Number
Doctor Low 0
Doctor Medium 5
Doctor High 8
Nurse Low 1
Nurse Medium 8
Nurse High...
254 просмотров
schedule
05.11.2021
Транспонирование фрейма данных
У меня вопрос о преобразовании (если это правильное слово) фрейма данных в его транспонированную версию. Хочу взять что-то вроде:
A B C
1 6 1
1 18 1
1 21 1
3 18 1
3 21 1
4 6 1
4 18 1
4 20 1
4 21 1
И...
189 просмотров
schedule
21.10.2021
ddply резюмировать по нескольким переменным
Я вижу, что ddply прекрасно суммирует и группирует по переменным. Я хочу, чтобы ddply просканировал очень большой фрейм данных только один раз и предоставил мне количество (длину) для более чем одной переменной. Как это может быть сделано?...
9311 просмотров
schedule
08.09.2021
Сводная функция R в ddply (plyr) простым способом
Как мне воспроизвести это с plyr ?
with(mtcars, tapply(mpg, cyl, summary))
С такой же элегантностью, то есть без подробного описания отдельных статистических данных?
2336 просмотров
schedule
17.10.2021
Как подсчитать все уникальные значения в data.frame
У меня есть набор данных с диагнозами в качестве переменных и пациентами в качестве наблюдений. Это 32 переменных и 5000 наблюдений.
Взгляните на этот пример.
Моя цель - подсчитать и суммировать все диагнозы во фрейме данных.
set.seed(1)...
1539 просмотров
schedule
21.10.2021
Извлечение данных из другого фрейма data.frame с помощью dplyr?
У меня есть фрейм данных под названием dat_new, по сути, это данные о посещении клиники, hrn - это идентификатор пациента, а dov - дата посещения (несколько посещений на человека). Затем у меня есть фрейм данных, называемый событием, с датой...
3996 просмотров
schedule
16.09.2021
Новая переменная на основе условной арифметики по группам
У меня есть data.frame df , где я хочу создать новую переменную, которая является долей другой по группе. То есть для каждого Species ID Plot Sub разделения я хотел бы найти пропорцию Area на Type . Если Type = 0, то PropArea == 1,...
80 просмотров
schedule
18.09.2021
Как заставить Зелига работать со списками
Я хочу взять список сопоставленных наборов данных (где наблюдения сопоставляются по их оценкам склонности, используя MatchIt Package ) для последующего моделирования в пакете Zelig .
В этом примере я буду сравнивать две процедуры ( t1 и t2 ),...
146 просмотров
schedule
11.11.2021
как использовать aaply и сохранить порядок размеров в массиве?
У меня есть массив с 3 измерениями. Я хотел бы применить функцию к 3-му измерению и вернуть массив. Мне было очень приятно, что plyr :: aaply делает почти то, что я хочу. Однако он меняет размеры моего массива. В документации мне говорилось, что...
422 просмотров
schedule
24.11.2021
Cumsum с plyr ddply не работает
Я пытаюсь использовать cumsum с ddply plyr , чтобы получить промежуточный итог. Однако я просто не понимаю, почему это не работает.
n = c(2, 3, 5)
s = c("aa", "bb", "cc")
dd = data.frame(n, s)
# n s
# 1 2 aa
# 2 3 bb
# 3 5 cc
test...
680 просмотров
schedule
13.11.2021
Нахождение частот всех возможных пар в R
Я работаю с большим набором данных о лекарствах и реакциях, используя R. На данный момент у меня есть данные, структурированные как очень высокий фрейм данных, в котором перечислены идентификационный номер отчета, название лекарства и сообщенные...
898 просмотров
schedule
04.10.2021
создание индекса, обусловленного значением в другом столбце; различия с течением времени
Я борюсь со следующей проблемой: фрейм данных ниже содержит изменение значения с течением времени для различных идентификаторов. Я пытаюсь получить увеличение / уменьшение этих значений на основе значения за год, когда произошло событие. В пределах...
127 просмотров
schedule
06.11.2021
Реструктуризация подмножества данных R
Я новичок в R / Rstudio и все еще учусь выполнять определенные операции. У меня есть следующий набор данных. Для столбцов у меня есть рабочий регион, тип элемента (CA, OBU), подэлемент и чистый доход. В настоящее время данные довольно большие (50...
87 просмотров
schedule
07.09.2021
Отсортируйте по году, затем подсчитайте фиктивные переменные для каждого округа (ddply)
Я создаю сводную таблицу для документа о репликации, и у меня возникают проблемы с ее выполнением с помощью ddply.
Мне нужно отсортировать по годам, а затем подсчитать, сколько округов (fips) имеет фиктивную переменную == 1 (RVPI == 1) за каждый...
120 просмотров
schedule
24.10.2021
подмножество df с повторяющимися последовательностями
Я много и мало искал решение этой проблемы, но не могу найти его ...
В моем фреймворке данных (по сути, это таблица спортивной команды №1 по дате) было множество случаев, когда одна или несколько команд «снова появлялись» в данных. Я хочу вытащить...
103 просмотров
schedule
29.10.2021
нормализовать все данные к одному гену (наблюдение) в r
У меня есть некоторые данные об экспрессии белков для 850 белков, и я хотел бы нормализовать эти данные для эталонного белка. Это хороший способ исправить технические ошибки. Я новичок в R и только что решил создать аккуратный набор данных. Но...
101 просмотров
schedule
16.11.2021