У меня есть набор панельных данных, состоящий из облигаций с ежедневными ценами, наблюдаемыми в течение определенного периода времени. Таким образом, каждая облигация повторяется вниз с соответствующими ежедневными ценовыми наблюдениями и датами (см. Рисунок ниже). Половина облигаций имеет зеленый цвет (идентифицируется фиктивной переменной), и каждая зеленая связь соответствует не зеленой связи, каждая пара идентифицируется идентификатором пары. Таким образом, зеленая облигация и соответствующая ей не зеленая облигация имеют одинаковый идентификатор пары и наблюдаются в течение одного и того же промежутка времени (скажем, 100 дней каждая), но индивидуальный идентификатор облигации уникален.
Я хочу измерить фиксированный эффект в каждой паре облигаций, чтобы выяснить, есть ли значительная разница в доходности к погашению (используемая переменная = ask.yield) между зеленой облигацией и соответствующей не зеленой облигацией. Таким образом, я считаю, что при идентификации данных панели в R, человек должен быть pair.id, а индекс времени должен быть date. Я использую следующую регрессию:
fixed <- plm(ask.yield ~ liquidity + green, data = paneldata, index = c(“pair.id”, “dates”), model = “within”)
Желаемый результат (не обращайте внимания на цифры):
Я получаю сообщение об ошибке:
Ошибка в pdim.default (индекс [1], индекс [2]): повторяющиеся пары (id-time)
Я понимаю сообщение об ошибке - каждая пара .id в данных панели записывается в одни и те же даты дважды (один раз для зеленой облигации и один для соответствующей не зеленой облигации).
Кто-нибудь знает, как обойти эту проблему и по-прежнему иметь возможность измерить фиксированный эффект в каждой паре облигаций?