Вопросы по теме 'dplyr'
Извлечение данных из другого фрейма data.frame с помощью dplyr?
У меня есть фрейм данных под названием dat_new, по сути, это данные о посещении клиники, hrn - это идентификатор пациента, а dov - дата посещения (несколько посещений на человека). Затем у меня есть фрейм данных, называемый событием, с датой...
3996 просмотров
schedule
16.09.2021
Вменение Hot Deck в dplyr
Я пытаюсь провести вменение «горячей колоды» в R с пакетом dplyr . У меня есть не конечные значения, которые я хотел бы заменить случайным значением, полученным из той же группы.
myData <- data.frame(value = sample(c(Inf, NaN, 1:8), 100,...
853 просмотров
schedule
14.09.2021
поведение dplyr row_number () в логической операции
Отвечая на другой вопрос , я столкнулся с поведением of dplyr::row_number() , что было для меня немного неожиданным, и мне интересно, должно ли это быть таким поведением и по какой причине. Вот пример: я хочу провести два логических теста,...
1068 просмотров
schedule
11.10.2021
dplyr: количество / процент факторов, сгруппированных по школе, не сгруппированных
У меня есть длинный набор данных с одной строкой на каждого человека, сгруппированный по школам. В каждой строке есть упорядоченный множитель {1, 2, 3, 4}, «коты». Я хочу получить процентное соотношение оценок 1, 2, 3 и 4 в каждой школе. Набор...
7615 просмотров
schedule
02.11.2021
Использование dplyr для добавления итоговых строк
Gender Year.10 Year.11 Year.12 Year.13 Year.10.1 Year.11.1 Year.12.1 Year.13.1
1 FEMALE 1181980 1113480 1040960 1033150 1116220 1059850 1022950 974490
2 MALE 674020 783150 571170 594330 641620 767590 554290...
3566 просмотров
schedule
23.09.2021
использование имен столбцов переменных в dplyr (do)
У меня есть следующие данные для примера
d.1 = data.frame(id=c(1,1,2,3,3), date=c(2001,2002,2001,2001,2003), measure=c(1:5))
d.2 = data.frame(id=c(1,2,2,3,3), date=c(2001,2002,2003,2002,2008), measure=c(1:5))
d = merge(d.1,d.2, all=T, by="id")...
528 просмотров
schedule
22.09.2021
Используйте dplyr для определения частоты генотипов по SNP
Чтобы найти частоту генотипов в SNP, мне нужно найти долю определенного генотипа (XX, YX или YY) в общем количестве образцов (XX, YX и YY). Я думаю, мне нужно было бы начать мое заявление dplyr с
dat %>% group_by(Assay) %>%
но я не...
108 просмотров
schedule
27.11.2021
Использование оператора% ›% из dplyr без загрузки dplyr в R
В настоящее время я создаю пакет, и мне было интересно, есть ли способ вызвать оператор %>% из dplyr без фактического присоединения пакета dplyr. Например, с любой функцией, которая экспортируется из пакета, вы можете вызвать ее с двойным...
3334 просмотров
schedule
30.11.2021
Создать столбец с сгруппированными значениями на основе другого столбца
Я уверен, что об этом уже спрашивали, но я не знаю, что искать, поэтому заранее прошу прощения.
Допустим, у меня есть следующий фрейм данных:
grades <- data.frame(a = 1:40, b = sample(45:100, 40))
Используя deplyr, я хочу создать новую...
16740 просмотров
schedule
22.11.2021
разница между plyr :: mutate и dplyr :: mutate
dplyr::mutate() работает так же, как plyr::mutate() , и аналогично base::transform() . Ключевое различие между mutate() и transform() заключается в том, что mutate позволяет вам ссылаться на столбцы, которые вы только что создали. -...
2054 просмотров
schedule
16.11.2021
R dplyr / tidyr: изменить новые столбцы данными из других наблюдений
Я пытаюсь создать две новые переменные, используя функции dplyr / tidyr, используя данные из предыдущих, но связанных строк. В моем примере у меня есть data.frame с данными для ID, YEAR и AMOUNT (см. Ниже).
ID YEAR AMOUNT
A 2000...
1325 просмотров
schedule
30.11.2021
Добавляйте кадры данных по строкам с помощью [d] plyr
У меня есть два фрейма данных
df1
# a b
# 1 10 20
# 2 11 21
# 3 12 22
# 4 13 23
# 5 14 24
# 6 15 25
df2
# a b
# 1 4 8
Мне нужен следующий результат:
df3
# a b
# 1 14 28
# 2 15 29
# 3 16 30
# 4 17 31
# 5 18 32
# 6 19 33...
209 просмотров
schedule
18.09.2021
Многоуровневый заказ с dplyr
У меня есть следующий фрейм данных:
tdf <- structure(list(GO = c("Cytokine-cytokine receptor interaction",
"Cytokine-cytokine receptor interaction|Endocytosis", "I-kappaB kinase/NF-kappaB signaling",
"NF-kappa B signaling pathway", "NF-kappaB...
500 просмотров
schedule
06.11.2021
Фильтрация по дате с помощью dplyr без изменения формата переменной
Я хочу использовать список лет для фильтрации базы данных по дате
years<-c("2014")
yearsdata <- data.frame(animal=c("cow","pig"),
mydate=c(as.Date("2015-01-01"),
as.Date("2014-01-01")))...
3959 просмотров
schedule
30.11.2021
Дублирующиеся строки, появляющиеся при использовании group_by и суммировании
У меня есть таблица данных, и я получаю повторяющиеся строки при использовании функции суммирования в сочетании с group_by.
Приведу упрощенный пример своей проблемы. Во-первых, я использую group_by и изменяю, чтобы добавить сумму «значения» для...
105 просмотров
schedule
06.12.2021
dplyr + meta-columns: когда столбец содержит имена других столбцов для использования вместо данных
Интересно, имеет ли следующий вопрос элегантное решение в dplyr.
Чтобы предоставить простой воспроизводимый пример, рассмотрим следующий data.frame:
df <- data.frame( a=1:5, b=2:6, c=3:7,
ref=c("a","a","b","b","c"),...
193 просмотров
schedule
14.10.2021
Агрегирование при объединении двух фреймов данных в R
Конечная цель - суммировать общее количество ( transact_data$qty ) для каждой записи в product_info , где transact_data$productId существует в product_info , а где transact_data$date находится между product_info$beg_date и...
130 просмотров
schedule
12.11.2021
R dplyr, использование mutate с na.omit вызывает ошибку несовместимого размера (% d)
Я занимаюсь очисткой данных. Я часто использую mutate в Dplyr, поскольку он генерирует новые столбцы шаг за шагом, и я легко могу увидеть, как это происходит.
Вот два примера, где у меня есть эта ошибка
Error: incompatible size (%d), expecting...
3551 просмотров
schedule
26.10.2021
dplyr: ошибка с построчным изменением с NA
Я получаю странные ошибки с построчным mutate в dplyr . Вот пример:
set.seed(1)
df <- data.frame(a = rnorm(5), b = rnorm(5))
df[2,'b'] <- NA
С sum нет проблем, но функции сводки проблематичны:
mutate(rowwise(df), sum(a, b,...
1630 просмотров
schedule
25.11.2021
Ошибка в ggplot.data.frame: сопоставление следует создавать с помощью aes или aes_string
У меня возникла проблема при извлечении пути из ggplot , и у меня возникла ошибка.
Изображение, приведенное ниже, объясняет результат, который я ищу: (Сделано в редакторе изображений для пояснения цели)
Предположим, что «Сюжет 1» - это...
45018 просмотров
schedule
01.10.2021