Я работаю с набором данных, который включает 118 979 наблюдений по 9 широким переменным в Stata 16.0. Наиболее важной переменной является то, сообщает ли компания, наблюдающая за несколькими датами, «GPS» или «EPS». Эти компании могут сообщать как наблюдение «GPS» в точке данных, так и наблюдение «EPS» в следующей точке данных. Пожалуйста, обратитесь к обзору данных ниже для дальнейшей визуализации.
Образец данных:
clear
input str8 cusip8 str16 cname str4 measure double actual long anndats_act float(fyear tanalyst meanforcast UE)
"87482X10" "TALMER BANCORP" "EPS" 1.21 20118 2014 29 .8686207 .3930131
"87482X10" "TALMER BANCORP" "GPS" 1.02 20479 2015 34 .8576471 .1893004
Мне нужно отказаться от наблюдений GPS (за несколько дат), как только идентификатор (являющийся cusip8 в таблице выше) сообщил о EPS за несколько дат. То есть, если компания сообщила GPS, а также EPS, например, в 1 января 2010 г., я хочу отказаться от наблюдения GPS, чтобы сохранить EPS. Если компания сообщает только о GPS и не сообщает о EPS в заданную дату, я хочу сохранить данные GPS-наблюдения в моем наборе данных.