Как измерить фиксированный эффект пары лиц, использующих пакет PLM в R?

У меня есть набор панельных данных, состоящий из облигаций с ежедневными ценами, наблюдаемыми в течение определенного периода времени. Таким образом, каждая облигация повторяется вниз с соответствующими ежедневными ценовыми наблюдениями и датами (см. Рисунок ниже). Половина облигаций имеет зеленый цвет (идентифицируется фиктивной переменной), и каждая зеленая связь соответствует не зеленой связи, каждая пара идентифицируется идентификатором пары. Таким образом, зеленая облигация и соответствующая ей не зеленая облигация имеют одинаковый идентификатор пары и наблюдаются в течение одного и того же промежутка времени (скажем, 100 дней каждая), но индивидуальный идентификатор облигации уникален.

Paneldata, скриншот

Я хочу измерить фиксированный эффект в каждой паре облигаций, чтобы выяснить, есть ли значительная разница в доходности к погашению (используемая переменная = ask.yield) между зеленой облигацией и соответствующей не зеленой облигацией. Таким образом, я считаю, что при идентификации данных панели в R, человек должен быть pair.id, а индекс времени должен быть date. Я использую следующую регрессию:

fixed <- plm(ask.yield ~ liquidity + green, data = paneldata, index = c(“pair.id”, “dates”), model = “within”)

Желаемый результат (не обращайте внимания на цифры):

img2

Я получаю сообщение об ошибке:

Ошибка в pdim.default (индекс [1], индекс [2]): повторяющиеся пары (id-time)

Я понимаю сообщение об ошибке - каждая пара .id в данных панели записывается в одни и те же даты дважды (один раз для зеленой облигации и один для соответствующей не зеленой облигации).

Кто-нибудь знает, как обойти эту проблему и по-прежнему иметь возможность измерить фиксированный эффект в каждой паре облигаций?


person kakaka    schedule 06.11.2019    source источник


Ответы (1)


Из-за ошибки в парном идентификаторе есть дублирование, иначе комбинация pair.id и dates не уникальна. Можете ли вы проверить, уникальны ли значения date для каждого pair.id?

Если это так, вам может потребоваться преобразовать date в str, в зависимости от типа данных дата может быть преобразована в какое-либо значение, которое может привести к дублированию значений.

Надеюсь, это поможет, поскольку у меня нет данных, у меня нет возможности воспроизвести.

person Bill Chen    schedule 06.11.2019
comment
Спасибо, что ответили @Bill Chen! Верно, что даты не уникальны для каждой пары .id. Это потому, что для каждой пары pair.id мы наблюдаем две связи (одну зеленую и одну не зеленую) в течение одного и того же периода времени. Таким образом, каждая дата будет соблюдаться два раза в пределах каждой пары .id. И я понимаю, что это проблема (в отношении ошибки), но мне действительно нужен способ обойти ее, чтобы я мог извлечь фиксированный эффект в каждой паре связей. Я постараюсь преобразовать дату в str, как вы говорите. Если есть способ добавить сюда набор данных, я был бы рад это сделать - person kakaka; 07.11.2019
comment
@kakaka оставьте ссылку с Dropbox или что-то в этом роде. - person Bill Chen; 07.11.2019