Вопросы по теме 'summarize'

Обобщение фрейма данных с ограничением с помощью Dplyr
У меня есть фрейм данных, подобный приведенному ниже: data <- data.frame(x = c("0", "2", "8", "1", "7", "10", "15", "14", "13", "11"), y = c("11", "5", "14", "9", "13", "7", "4", "0", "12", "8"), act_x =...
58 просмотров
schedule 26.09.2021

Суммируйте, но сохраняйте переменную длины (dplyr)
Основной вопрос dplyr ... Респонденты могли выбрать несколько компаний, которые они используют. Например: library(dplyr) test <- tibble( CompanyA = rep(c(0:1),5), CompanyB = rep(c(1),10), CompanyC = c(1,1,1,1,0,0,1,1,1,1) ) test Если...
178 просмотров
schedule 30.09.2021

Быстрый способ суммирования кадра данных по столбцам
У меня есть это data.frame из пяти возможных character состояний ( genotypes ): genotypes <- c("0/0","1/1","0/1","1/0","./.") library(dplyr) set.seed(1) df <- do.call(rbind, lapply(1:100, function(i) matrix(sample(genotypes, 30,...
86 просмотров
schedule 17.11.2021

R Помогите! Рассчитайте долю на подгруппу
У меня есть следующий набор данных под названием GrossExp3 , охватывающий двусторонний экспорт (в 1000 долларов США) 15 стран-репортеров за все годы с (1998–2018 гг.) Во все доступные страны-партнеры. Он охватывает следующие четыре переменных :...
33 просмотров

Несогласованные множественные квантили ddply по группе
Я пытаюсь использовать ddply для суммирования медианы и 25/75 прецентилей нескольких групп в относительно небольшом наборе данных. Я группирую по DoseWt измеренные точки данных AUC_INFobs и Cmax. (Использование R 4.0.4 в RStudio 1.3.1093 в Windows...
20 просмотров
schedule 23.10.2021

Как добавить вторичную сводку ранее сгруппированных / обобщенных данных для сортировки в R с помощью dplyr
Я рисую две группы - до и после Каждая группа имеет 2 уровня - вверх, вниз Для каждого уровня я рассчитал итоговую статистику, count Я пытаюсь создать новую сводную статистику, которая представляет собой общее количество каждого уровня в базе...
42 просмотров
schedule 19.02.2022

Как добавить значения одного столбца на основе условного оператора другого столбца, в котором есть пустые ячейки?
Я пытаюсь разбить данные на подмножество на основе условного оператора столбца с пустыми значениями, что означает, что сотрудник входил в систему несколько раз для выполнения рабочего задания. Пример набора данных показан ниже: employee_name...
45 просмотров
schedule 11.03.2022

Оператор ifelse в функции суммирования R: dplyr
Я пытаюсь подсчитать количество посещений, проведенных поставщиком, если посещение соответствует квалификации в R. В закомментированной фразе я могу получить каждого поставщика с правильным общим числом посещений, но когда я пытаюсь установить if...
261 просмотров
schedule 15.03.2022

Как распечатать минимум и максимум сводной статистики на уровне факторов (взяв минимум и максимум медианы / пропорции)?
У меня есть следующие данные, включая 10 продуктов (a, b, c, ...) и их описания (другие переменные). Мне нужно сообщить, как сводная статистика других переменных (медиана / пропорция) варьируется между продуктами (должна быть напечатана как минимум...
55 просмотров
schedule 18.03.2022

Подведите итоги, используя различные группирующие переменные в dplyr
Я хотел бы резюмировать фрейм данных, используя разные группирующие переменные для каждой сводки, которую я хочу выполнить. В качестве примера у меня есть три переменные (x1, x2, x3). Я хочу сгруппировать фрейм данных по x1 и получить количество...
86 просмотров
schedule 07.04.2022

Поиск диапазона на основе минимальных значений, который увеличивает
У меня есть набор данных с несколькими станциями, глубинами и концентрациями. Я пытаюсь найти разницу в глубине (или толщине) в зависимости от того, где минимальная концентрация увеличивается на 0,1. Например: на станции 1 максимальная глубина...
66 просмотров
schedule 12.05.2022

Извлечение уникальной комбинации столбцов и нахождение суммы и количества в R
У меня есть база данных полетов с 4 столбцами, как показано ниже. Оригинал: Мне нужен вывод, который дает строки на основе уникальной комбинации из 3 столбцов (место отправления/пункт назначения/авиакомпания), суммирует количество...
60 просмотров
schedule 14.05.2022

Скользящее средневзвешенное значение по двум уровням фактора или моментам времени
Я хотел бы создать скользящее среднее значение за 2 квартала для альфы, браво и чарли (и многих других переменных. Исследования приводят меня к зоопарку и смазке пакетов, но, кажется, всегда возвращаюсь к скользящему внутри одной переменной или...
169 просмотров

tidyverse: подсчитывать номер определенного уровня при подведении итогов
Хотелось бы, обобщая после группировки, подсчитывать количество конкретного уровня другого фактора. В приведенном ниже рабочем примере я хотел бы подсчитать количество уровней "male" в каждой группе. Я пробовал много вещей с подсчетом, подсчетом...
2996 просмотров
schedule 02.06.2022

Использование данных mtcars для составления сводной таблицы цилиндров по сравнению с центрированными (миль на галлон)
Не знаю ... Я использую R / RStudio с данными mtcars , dplyr , mutate и команды суммировать . Также попробовал группу по . Я хочу центрировать значения mtcars $ mpg , затем взять эту информацию и отобразить сводку количества цилиндров по...
63 просмотров
schedule 13.07.2022

Замените несколько операторов `summarize` функцией
В настоящее время я повторяю много кода, так как мне нужно summarize всегда использовать одни и те же столбцы для разных групп. Как я могу сделать это эффективно, написав функцию summarize (которая всегда одна и та же) только один раз, но...
104 просмотров
schedule 19.07.2022

Вычислять итоговые значения при суммировании сгруппированных данных
У меня есть кадр данных, в котором я сгруппировал данные, я запускаю сводную статистику по группам, но также хочу получить сводную статистику для всего вместе. Есть ли более простой способ сделать это, чем сделать это дважды и объединить, как...
40 просмотров
schedule 31.07.2022

Как суммировать символы, факторы и числовые векторы в R
Я пытаюсь использовать summ_all, чтобы найти среднее значение каждого идентификатора. Я могу сделать это успешно для столбца ID и столбца, для которого я пытаюсь найти среднее значение (скорость). Однако, когда я использую приведенный ниже код, все...
558 просмотров
schedule 04.08.2022

Как усреднить все столбцы в наборе данных по группе
Я использую агрегат в R, чтобы попытаться обобщить свой набор данных. В настоящее время у меня есть 3-5 наблюдений для каждого идентификатора, и мне нужно усреднить их, чтобы у меня было 1 значение (среднее) для каждого идентификатора. Некоторые...
346 просмотров
schedule 31.08.2022

dplyr: group_by и суммировать, чтобы свернуть (посредством конкатенации) столбцы строк, содержащих NA
У меня относительно простой вопрос, на который я не смог найти решение. Предположим, у меня есть следующий набор данных: ID dummy_var String1 String2 String3 1 0 Tom NA NA 1 1 NA Jo NA 2 0...
49 просмотров
schedule 14.09.2022