Вопросы по теме 'dummy-variable'

R - нехватка памяти при преобразовании в фиктивные переменные
У меня есть набор данных с категориальной переменной с уродливым количеством уровней (5000 или около того). Когда я запустил свой код для преобразования в фиктивные переменные, он сказал, что ему нужно 22 гигабайта памяти и вылетает dmy <-...
324 просмотров
schedule 16.11.2021

Как сделать одну переменную фактора горячего кодирования, которая имеет более 3 уровней?
Я хочу представить факторные переменные как значения 0 и 1 с помощью одного горячего кодирования в r как data.frame. Среди факторных переменных я хотел бы выполнить одно горячее кодирование только для переменных с тремя или более уровнями. Это...
991 просмотров
schedule 24.09.2021

Добавление вектора фиктивных переменных в логистическую регрессию
В настоящее время я пытаюсь провести логистическую регрессию, где одна из переменных представляет собой вектор из 32 фиктивных переменных. Каждый манекен представляет собой разновидность преступления. Например: narcotics <-...
511 просмотров

Как применить модели scikit learn к невидимым данным другой формы? Get Dummies вызывает проблемы
Скажем, я обучаю модель для обнаружения оттока, и набор данных имеет следующие функции (очень упрощенно). У меня есть марки и девушки, которые зарегистрировались онлайн или по почте. ID source Gender Churn 1 Online M 1 2 Post M...
48 просмотров

R dplyr вложенное фиктивное кодирование
Мне нужно перекодировать набор данных тестовых ответов для использования в другом приложении (программе под названием BLIMP, которая вменяет недостающие значения). В частности, мне нужно представить элементы теста и назначения подшкалы с помощью...
52 просмотров
schedule 24.02.2022

Сохраняйте одну и ту же фиктивную переменную в данных обучения и тестирования
Я создаю модель прогнозирования на Python с двумя отдельными наборами для обучения и тестирования. Данные обучения содержат категориальную переменную числового типа, например, почтовый индекс, [91521,23151,12355, ...], а также строковые...
29287 просмотров

Фиктивные переменные, нужно ли их стандартизировать?
У меня есть следующий набор данных, представленный как массив numpy direccion_viento_pos Out[32]: array([['S'], ['S'], ['S'], ..., ['SO'], ['NO'], ['SO']],...
6367 просмотров

После создания фиктивных переменных?
Я пытаюсь заменить переменные категории фиктивными переменными. «сезон», «праздник», «рабочий день», «погода», «температура», «атем.», «влажность», «скорость ветра», «зарегистрированный», «счетчик», «час», «доу» - все переменные. . Вот мой код:...
183 просмотров
schedule 22.03.2022

Группировка трех столбцов, а затем сравнение значения, если четвертый
Я работаю над данными о выборах за 2008–2017 годы. Я в некоторой степени продолжил анализ. Однако я задаю следующий вопрос. Мне нужно определить, победила ли конкретная партия на выборах в определенном округе, если она победила в предыдущем туре...
26 просмотров
schedule 21.03.2022

Создайте фиктивные переменные из нескольких столбцов и создайте новый фрейм данных
Мне нужно сделать фрейм данных манекенов из данных опроса, где респонденты указали слова в нескольких столбцах в фрейме данных. Вот упрощенный пример, чтобы проиллюстрировать, что мне нужно сделать? Одно слово здесь представлено буквой. id <-...
2022 просмотров
schedule 27.03.2022

Регрессия с фиктивной переменной, удалить фиктивный перехват, сохранив только условия взаимодействия
Я пытаюсь запустить регрессию с фиктивной переменной, которая принимает значение 0 до 2009 года и 1 после 2009 года, чтобы увидеть влияние финансового кризиса. Я делаю это, добавляя дополнительный столбец под названием «фиктивный» со значениями,...
100 просмотров
schedule 29.03.2022

таблица частот не работает для подмножеств
У меня есть набор данных и определены разные подмножества, чтобы искать частоты для фиктивных переменных. copying <- subset (reversals, Task =='copy') writing <- subset (reversals, Task =='write') изменить: Мои данные выглядят так:...
53 просмотров
schedule 08.04.2022

Фиктивные переменные - может ли значение этих двоичных переменных быть больше 1?
У меня есть следующий набор данных: **organization** **university** Facebook Harvard Facebook Harvard Facebook Harvard Wetpaint UC Berkeley Wetpaint LSE Это...
25 просмотров
schedule 01.06.2022

pandas get_dummies() для нескольких столбцов с заранее определенным списком
Я изо всех сил пытаюсь создать столбцы манекенов для моего фрейма данных. Это мой оригинальный фрейм данных: df = pd.DataFrame({'id': ['01', '02', '03'], 'Q1': ['a', 'b', 'a'], 'Q2': ['c', 'b', 'a']})...
38 просмотров
schedule 03.06.2022

Фиктивная переменная, обусловленная повторениями в сгруппированных наблюдениях
РЕДАКТИРОВАТЬ Спасибо за ваши ответы. Однако мне все еще не удалось решить свою проблему, поскольку мой набор данных содержит 700000 наблюдений, и все приведенные ниже подходы приводят к ошибке или просто продолжают работать часами без завершения...
170 просмотров
schedule 15.06.2022

перекодирование гонки с 4 категорий на 3 категории и создание 2 манекенов в R
Я работаю с переменной для расы, которая принимает следующие значения: 1 черный, 2 латиноамериканец, 3 смешанная раса (не латиноамериканец), 4 не черный / не латиноамериканец. Я хочу суммировать 3 и 4 и сделать их базовой категорией, оставив...
837 просмотров
schedule 17.06.2022

Многомерная переменная Python One Hot Encode
Вот мой кадр данных: Name Job A Back-end Engineer B Front-end Engineer;Product Manager C Product Manager;Business Development;System Analyst Я хочу преобразовать этот кадр данных в фиктивный (одна горячая кодировка) следующим...
120 просмотров

Как применить линейную регрессию sklearn для некоторой строковой переменной
Я собираюсь предсказать кассовые сборы фильма, используя логистическую регрессию. У меня есть некоторые данные о поезде, включая актеров и режиссеров. Это мои данные: Director1|Actor1|300 million Director2|Actor2|500 million Я собираюсь...
908 просмотров

Кусочно-линейная регрессия с ограничением - r
Я пытаюсь выполнить кусочно-линейный регрессионный анализ OLS в R с одной точкой останова. У меня есть следующая формула регрессии и ограничения: Где D — манекен. Я хотел бы наложить ограничение, чтобы линии регрессии были непрерывными (с...
708 просмотров

конвертировать низкие частые уровни категориальной переменной в другие в R
У меня есть категориальная переменная, которую я хочу преобразовать в манекены для задачи классификации. проблема в том, что некоторые уровни появляются всего несколько раз, поэтому они создают проблемы идеальной мультиколлинеарности, когда я...
38 просмотров
schedule 15.08.2022