Вопросы по теме 'dplyr'

Извлечение данных из другого фрейма data.frame с помощью dplyr?
У меня есть фрейм данных под названием dat_new, по сути, это данные о посещении клиники, hrn - это идентификатор пациента, а dov - дата посещения (несколько посещений на человека). Затем у меня есть фрейм данных, называемый событием, с датой...
3996 просмотров
schedule 16.09.2021

Вменение Hot Deck в dplyr
Я пытаюсь провести вменение «горячей колоды» в R с пакетом dplyr . У меня есть не конечные значения, которые я хотел бы заменить случайным значением, полученным из той же группы. myData <- data.frame(value = sample(c(Inf, NaN, 1:8), 100,...
853 просмотров
schedule 14.09.2021

поведение dplyr row_number () в логической операции
Отвечая на другой вопрос , я столкнулся с поведением of dplyr::row_number() , что было для меня немного неожиданным, и мне интересно, должно ли это быть таким поведением и по какой причине. Вот пример: я хочу провести два логических теста,...
1068 просмотров
schedule 11.10.2021

dplyr: количество / процент факторов, сгруппированных по школе, не сгруппированных
У меня есть длинный набор данных с одной строкой на каждого человека, сгруппированный по школам. В каждой строке есть упорядоченный множитель {1, 2, 3, 4}, «коты». Я хочу получить процентное соотношение оценок 1, 2, 3 и 4 в каждой школе. Набор...
7615 просмотров
schedule 02.11.2021

Использование dplyr для добавления итоговых строк
Gender Year.10 Year.11 Year.12 Year.13 Year.10.1 Year.11.1 Year.12.1 Year.13.1 1 FEMALE 1181980 1113480 1040960 1033150 1116220 1059850 1022950 974490 2 MALE 674020 783150 571170 594330 641620 767590 554290...
3566 просмотров
schedule 23.09.2021

использование имен столбцов переменных в dplyr (do)
У меня есть следующие данные для примера d.1 = data.frame(id=c(1,1,2,3,3), date=c(2001,2002,2001,2001,2003), measure=c(1:5)) d.2 = data.frame(id=c(1,2,2,3,3), date=c(2001,2002,2003,2002,2008), measure=c(1:5)) d = merge(d.1,d.2, all=T, by="id")...
528 просмотров
schedule 22.09.2021

Используйте dplyr для определения частоты генотипов по SNP
Чтобы найти частоту генотипов в SNP, мне нужно найти долю определенного генотипа (XX, YX или YY) в общем количестве образцов (XX, YX и YY). Я думаю, мне нужно было бы начать мое заявление dplyr с dat %>% group_by(Assay) %>% но я не...
108 просмотров
schedule 27.11.2021

Использование оператора% ›% из dplyr без загрузки dplyr в R
В настоящее время я создаю пакет, и мне было интересно, есть ли способ вызвать оператор %>% из dplyr без фактического присоединения пакета dplyr. Например, с любой функцией, которая экспортируется из пакета, вы можете вызвать ее с двойным...
3334 просмотров
schedule 30.11.2021

Создать столбец с сгруппированными значениями на основе другого столбца
Я уверен, что об этом уже спрашивали, но я не знаю, что искать, поэтому заранее прошу прощения. Допустим, у меня есть следующий фрейм данных: grades <- data.frame(a = 1:40, b = sample(45:100, 40)) Используя deplyr, я хочу создать новую...
16740 просмотров
schedule 22.11.2021

разница между plyr :: mutate и dplyr :: mutate
dplyr::mutate() работает так же, как plyr::mutate() , и аналогично base::transform() . Ключевое различие между mutate() и transform() заключается в том, что mutate позволяет вам ссылаться на столбцы, которые вы только что создали. -...
2054 просмотров
schedule 16.11.2021

R dplyr / tidyr: изменить новые столбцы данными из других наблюдений
Я пытаюсь создать две новые переменные, используя функции dplyr / tidyr, используя данные из предыдущих, но связанных строк. В моем примере у меня есть data.frame с данными для ID, YEAR и AMOUNT (см. Ниже). ID YEAR AMOUNT A 2000...
1325 просмотров
schedule 30.11.2021

Добавляйте кадры данных по строкам с помощью [d] plyr
У меня есть два фрейма данных df1 # a b # 1 10 20 # 2 11 21 # 3 12 22 # 4 13 23 # 5 14 24 # 6 15 25 df2 # a b # 1 4 8 Мне нужен следующий результат: df3 # a b # 1 14 28 # 2 15 29 # 3 16 30 # 4 17 31 # 5 18 32 # 6 19 33...
209 просмотров
schedule 18.09.2021

Многоуровневый заказ с dplyr
У меня есть следующий фрейм данных: tdf <- structure(list(GO = c("Cytokine-cytokine receptor interaction", "Cytokine-cytokine receptor interaction|Endocytosis", "I-kappaB kinase/NF-kappaB signaling", "NF-kappa B signaling pathway", "NF-kappaB...
500 просмотров
schedule 06.11.2021

Фильтрация по дате с помощью dplyr без изменения формата переменной
Я хочу использовать список лет для фильтрации базы данных по дате years<-c("2014") yearsdata <- data.frame(animal=c("cow","pig"), mydate=c(as.Date("2015-01-01"), as.Date("2014-01-01")))...
3959 просмотров
schedule 30.11.2021

Дублирующиеся строки, появляющиеся при использовании group_by и суммировании
У меня есть таблица данных, и я получаю повторяющиеся строки при использовании функции суммирования в сочетании с group_by. Приведу упрощенный пример своей проблемы. Во-первых, я использую group_by и изменяю, чтобы добавить сумму «значения» для...
105 просмотров
schedule 06.12.2021

dplyr + meta-columns: когда столбец содержит имена других столбцов для использования вместо данных
Интересно, имеет ли следующий вопрос элегантное решение в dplyr. Чтобы предоставить простой воспроизводимый пример, рассмотрим следующий data.frame: df <- data.frame( a=1:5, b=2:6, c=3:7, ref=c("a","a","b","b","c"),...
193 просмотров
schedule 14.10.2021

Агрегирование при объединении двух фреймов данных в R
Конечная цель - суммировать общее количество ( transact_data$qty ) для каждой записи в product_info , где transact_data$productId существует в product_info , а где transact_data$date находится между product_info$beg_date и...
130 просмотров
schedule 12.11.2021

R dplyr, использование mutate с na.omit вызывает ошибку несовместимого размера (% d)
Я занимаюсь очисткой данных. Я часто использую mutate в Dplyr, поскольку он генерирует новые столбцы шаг за шагом, и я легко могу увидеть, как это происходит. Вот два примера, где у меня есть эта ошибка Error: incompatible size (%d), expecting...
3551 просмотров
schedule 26.10.2021

dplyr: ошибка с построчным изменением с NA
Я получаю странные ошибки с построчным mutate в dplyr . Вот пример: set.seed(1) df <- data.frame(a = rnorm(5), b = rnorm(5)) df[2,'b'] <- NA С sum нет проблем, но функции сводки проблематичны: mutate(rowwise(df), sum(a, b,...
1630 просмотров
schedule 25.11.2021

Ошибка в ggplot.data.frame: сопоставление следует создавать с помощью aes или aes_string
У меня возникла проблема при извлечении пути из ggplot , и у меня возникла ошибка. Изображение, приведенное ниже, объясняет результат, который я ищу: (Сделано в редакторе изображений для пояснения цели) Предположим, что «Сюжет 1» - это...
45018 просмотров
schedule 01.10.2021