Вопросы по теме 'dummy-variable'
R - нехватка памяти при преобразовании в фиктивные переменные
У меня есть набор данных с категориальной переменной с уродливым количеством уровней (5000 или около того). Когда я запустил свой код для преобразования в фиктивные переменные, он сказал, что ему нужно 22 гигабайта памяти и вылетает
dmy <-...
324 просмотров
schedule
16.11.2021
Как сделать одну переменную фактора горячего кодирования, которая имеет более 3 уровней?
Я хочу представить факторные переменные как значения 0 и 1 с помощью одного горячего кодирования в r как data.frame.
Среди факторных переменных я хотел бы выполнить одно горячее кодирование только для переменных с тремя или более уровнями.
Это...
991 просмотров
schedule
24.09.2021
Добавление вектора фиктивных переменных в логистическую регрессию
В настоящее время я пытаюсь провести логистическую регрессию, где одна из переменных представляет собой вектор из 32 фиктивных переменных. Каждый манекен представляет собой разновидность преступления. Например:
narcotics <-...
511 просмотров
schedule
31.10.2021
Как применить модели scikit learn к невидимым данным другой формы? Get Dummies вызывает проблемы
Скажем, я обучаю модель для обнаружения оттока, и набор данных имеет следующие функции (очень упрощенно). У меня есть марки и девушки, которые зарегистрировались онлайн или по почте.
ID source Gender Churn
1 Online M 1
2 Post M...
48 просмотров
schedule
04.10.2021
R dplyr вложенное фиктивное кодирование
Мне нужно перекодировать набор данных тестовых ответов для использования в другом приложении (программе под названием BLIMP, которая вменяет недостающие значения). В частности, мне нужно представить элементы теста и назначения подшкалы с помощью...
52 просмотров
schedule
24.02.2022
Сохраняйте одну и ту же фиктивную переменную в данных обучения и тестирования
Я создаю модель прогнозирования на Python с двумя отдельными наборами для обучения и тестирования. Данные обучения содержат категориальную переменную числового типа, например, почтовый индекс, [91521,23151,12355, ...], а также строковые...
29287 просмотров
schedule
25.02.2022
Фиктивные переменные, нужно ли их стандартизировать?
У меня есть следующий набор данных, представленный как массив numpy
direccion_viento_pos
Out[32]:
array([['S'],
['S'],
['S'],
...,
['SO'],
['NO'],
['SO']],...
6367 просмотров
schedule
15.03.2022
После создания фиктивных переменных?
Я пытаюсь заменить переменные категории фиктивными переменными. «сезон», «праздник», «рабочий день», «погода», «температура», «атем.», «влажность», «скорость ветра», «зарегистрированный», «счетчик», «час», «доу» - все переменные. .
Вот мой код:...
183 просмотров
schedule
22.03.2022
Группировка трех столбцов, а затем сравнение значения, если четвертый
Я работаю над данными о выборах за 2008–2017 годы. Я в некоторой степени продолжил анализ. Однако я задаю следующий вопрос.
Мне нужно определить, победила ли конкретная партия на выборах в определенном округе, если она победила в предыдущем туре...
26 просмотров
schedule
21.03.2022
Создайте фиктивные переменные из нескольких столбцов и создайте новый фрейм данных
Мне нужно сделать фрейм данных манекенов из данных опроса, где респонденты указали слова в нескольких столбцах в фрейме данных. Вот упрощенный пример, чтобы проиллюстрировать, что мне нужно сделать? Одно слово здесь представлено буквой.
id <-...
2022 просмотров
schedule
27.03.2022
Регрессия с фиктивной переменной, удалить фиктивный перехват, сохранив только условия взаимодействия
Я пытаюсь запустить регрессию с фиктивной переменной, которая принимает значение 0 до 2009 года и 1 после 2009 года, чтобы увидеть влияние финансового кризиса.
Я делаю это, добавляя дополнительный столбец под названием «фиктивный» со значениями,...
100 просмотров
schedule
29.03.2022
таблица частот не работает для подмножеств
У меня есть набор данных и определены разные подмножества, чтобы искать частоты для фиктивных переменных.
copying <- subset (reversals, Task =='copy')
writing <- subset (reversals, Task =='write')
изменить: Мои данные выглядят так:...
53 просмотров
schedule
08.04.2022
Фиктивные переменные - может ли значение этих двоичных переменных быть больше 1?
У меня есть следующий набор данных:
**organization** **university**
Facebook Harvard
Facebook Harvard
Facebook Harvard
Wetpaint UC Berkeley
Wetpaint LSE
Это...
25 просмотров
schedule
01.06.2022
pandas get_dummies() для нескольких столбцов с заранее определенным списком
Я изо всех сил пытаюсь создать столбцы манекенов для моего фрейма данных.
Это мой оригинальный фрейм данных:
df = pd.DataFrame({'id': ['01', '02', '03'],
'Q1': ['a', 'b', 'a'],
'Q2': ['c', 'b', 'a']})...
38 просмотров
schedule
03.06.2022
Фиктивная переменная, обусловленная повторениями в сгруппированных наблюдениях
РЕДАКТИРОВАТЬ
Спасибо за ваши ответы. Однако мне все еще не удалось решить свою проблему, поскольку мой набор данных содержит 700000 наблюдений, и все приведенные ниже подходы приводят к ошибке или просто продолжают работать часами без завершения...
170 просмотров
schedule
15.06.2022
перекодирование гонки с 4 категорий на 3 категории и создание 2 манекенов в R
Я работаю с переменной для расы, которая принимает следующие значения: 1 черный, 2 латиноамериканец, 3 смешанная раса (не латиноамериканец), 4 не черный / не латиноамериканец. Я хочу суммировать 3 и 4 и сделать их базовой категорией, оставив...
837 просмотров
schedule
17.06.2022
Многомерная переменная Python One Hot Encode
Вот мой кадр данных:
Name Job
A Back-end Engineer
B Front-end Engineer;Product Manager
C Product Manager;Business Development;System Analyst
Я хочу преобразовать этот кадр данных в фиктивный (одна горячая кодировка) следующим...
120 просмотров
schedule
07.07.2022
Как применить линейную регрессию sklearn для некоторой строковой переменной
Я собираюсь предсказать кассовые сборы фильма, используя логистическую регрессию. У меня есть некоторые данные о поезде, включая актеров и режиссеров. Это мои данные:
Director1|Actor1|300 million
Director2|Actor2|500 million
Я собираюсь...
908 просмотров
schedule
10.07.2022
Кусочно-линейная регрессия с ограничением - r
Я пытаюсь выполнить кусочно-линейный регрессионный анализ OLS в R с одной точкой останова. У меня есть следующая формула регрессии и ограничения:
Где D — манекен. Я хотел бы наложить ограничение, чтобы линии регрессии были непрерывными (с...
708 просмотров
schedule
26.07.2022
конвертировать низкие частые уровни категориальной переменной в другие в R
У меня есть категориальная переменная, которую я хочу преобразовать в манекены для задачи классификации. проблема в том, что некоторые уровни появляются всего несколько раз, поэтому они создают проблемы идеальной мультиколлинеарности, когда я...
38 просмотров
schedule
15.08.2022