Вопросы по теме 'data-manipulation'

Разделить строки с разделителями в столбце и вставить как новые строки
У меня есть следующий фрейм данных: +-----+-------+ | V1 | V2 | +-----+-------+ | 1 | a,b,c | | 2 | a,c | | 3 | b,d | | 4 | e,f | | . | . | +-----+-------+ Каждый алфавит представляет собой символ, разделенный запятой....
94101 просмотров

Извлечение данных из другого фрейма data.frame с помощью dplyr?
У меня есть фрейм данных под названием dat_new, по сути, это данные о посещении клиники, hrn - это идентификатор пациента, а dov - дата посещения (несколько посещений на человека). Затем у меня есть фрейм данных, называемый событием, с датой...
3996 просмотров
schedule 16.09.2021

Сдвиг не-NA клеток влево
В моем наборе данных много NA, и мне нужно сдвинуть все эти ячейки (на уровне строки) влево. Пример - мой фрейм данных: df=data.frame(x=c("l","m",NA,NA,"p"),y=c(NA,"b","c",NA,NA),z=c("u",NA,"w","x","y")) df x y z 1...
3239 просмотров
schedule 08.09.2021

Как написать цикл по иерархическим данным (домашнее хозяйство-индивидуум) в статистике?
Сейчас я работаю над набором данных обследования домохозяйств, и я хотел бы дать некоторым членам дополнительные идентификаторы в соответствии с их родством с главой домохозяйства. В частности, мне нужно идентифицировать взрослых детей главы...
702 просмотров
schedule 08.09.2021

Как использовать значение, меньшее или равное значению столбца, в качестве условия для выбора строки в другом столбце?
Думаю, простой вопрос. По сути, я хочу использовать понятие «меньше или равно числу» в качестве условия для выбора строки одного столбца, а затем найти значение в той же строке в другом столбце. Но что произойдет, если число, указанное в условии, не...
4625 просмотров
schedule 01.10.2021

SAS, Min / Max средствами proc?
У меня есть свидание, похожее на что-то вроде, Date Rainfall Highest_Tmp_Reached Lowest_Tmp_Reached 1/5/93 5 10 3 1/6/93 12 K K 1/2/95...
667 просмотров
schedule 11.11.2021

Как создать последовательные столбцы (R)
У меня есть данные о рецептах, и я хотел бы узнать, сколько рецептов получал каждый человек в год с даты выдачи до конца его записи. Пример данных (первые 5 строк каждого идентификатора): ID Issue_Date index.date other.drugs 1: 1...
63 просмотров
schedule 22.09.2021

Быстрый поиск строк, содержащих значение с определенными требованиями к подстроке
У меня есть фрейм данных шириной 40 столбцов и длиной 3 миллиона. Каждая ячейка может содержать значение или отсутствовать. В каждой строке заполнено как минимум несколько ячеек. Мне интересно найти те строки, которые содержат любое значение,...
73 просмотров
schedule 13.10.2021

R - создать набор данных Panel из 2 наборов данных поперечного сечения
Не могли бы вы помочь мне со следующей задачей по созданию набора данных панели из двух наборов данных поперечного сечения? В частности, небольшая часть наборов данных поперечных сечений: 1) - данные1 ID| Yr | D | X...
599 просмотров
schedule 28.09.2021

Отслеживайте время в переменных состояния в таблицах данных в R
Представьте себе data.table в R , данное library(data.table) dtable = data.table( id = c(rep(1, 3), rep(2, 4), rep(3, 2)), time = c(seq(1, 3, 1), seq(1, 4, 1), seq(3, 4)), state_1 = c('A', 'A', 'B', 'A', 'B', 'B', 'B', 'A', 'A'),...
94 просмотров

Смешанные синхронизированные данные
У меня есть вектор, содержащий данные о времени, но есть проблема: некоторые записи указаны как даты (например, 10/11/2017), а другие записи указаны как даты с временем (например, , 15.12.2016 09:07:17). Для меня это проблематично, поскольку...
15 просмотров
schedule 09.09.2021

Разделение рваного столбца на фрагменты фиксированной длины
У меня есть набор данных, в котором один столбец представляет собой строку, состоящую из 1 числа, указывающего день недели, за которым следует любое количество блоков из 10 цифр: # A tibble: 7 x 3 respid record_type record_data...
99 просмотров
schedule 31.10.2021

Есть ли способ исключить определенные периоды данных о погоде из многослойной растровой сетки в R?
У меня есть сеточные данные о средней температуре за 16 лет в формате netCDF , размер файла довольно большой (около 3 ГБ). Изначально я использовал пакет raster для загрузки исходных данных с координатной сеткой в ​​объект RasterStack . Мне...
58 просмотров
schedule 05.09.2021

R Заполнение списка списков с помощью цикла вызывает ошибку
Я работаю над проектом, который требует от меня заполнения большого количества данных в списке списков. Я все время получаю сообщение об ошибке «Индекс за пределами допустимого диапазона». Я понимаю, что это значит, и я пытался отладить, но все, что...
480 просмотров
schedule 20.11.2021

R добавляет строки из перечисленных матриц в матрицу / фрейм данных, пропуская пропущенные значения
Я пытаюсь найти способ написать цикл (или функцию, подобную приложению), которая берет определенную строку из матрицы в списке, записывает ее в матрицу / фрейм данных, берет соответствующую строку из следующего элемента списка , и помещает его после...
58 просмотров
schedule 27.11.2021

создание полной матрицы смежности из частичной информации
Я have матрица, которая содержит всю информацию, необходимую для построения матриц смежности 5x5. Каждая строка представляет одну матрицу: [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 1 1 1 1 1 1 1 0 1...
51 просмотров

Как изменить нумерацию наблюдений на основе значения столбца
Ниже приведен упрощенный пример моих данных, столбец new - это тот столбец, который я хочу добавить в набор данных. По сути, я хочу переименовать riskset , используя 1,2,3,4 ..., чтобы мне было проще выполнять циклы. Числа в riskset...
72 просмотров
schedule 06.11.2021

Как в aPython Dataframe сопоставить первое событие на основе даты для каждого уникального идентификатора и зафиксировать это конкретное событие?
В Python у меня есть фрейм данных с идентификаторами и многими датами событий и типами событий. Я хочу найти первое событие для каждого идентификатора и создать новый столбец с указанием этой даты, а другой - создать еще один столбец для своего...
89 просмотров

Использование sed для удаления всех строк между двумя совпадающими шаблонами, включая совпадающие строки
Мне нужно удалить строки в файле между определенным сопоставленным шаблоном и совпадающей строкой. В приведенном ниже коде я хочу удалить строки от объекта Host "kali" { до следующего появления } (не до последнего появления}). а также удалите...
283 просмотров
schedule 11.11.2021

Как сопоставить и извлечь данные с использованием нескольких критериев из 2 рабочих листов?
У меня есть 2 листа: Sheet1 и Sheet2 , Sheet1 пуст, за исключением номеров продуктов. Мне нужно извлечь данные из Sheet2 в Sheet1 , чтобы дать более четкое представление о них. В Sheet1 регионы различаются как AP...
53 просмотров
schedule 08.09.2021