Получение файлов S-1 из EDGAR на основе SIC с использованием R

Я пытаюсь проанализировать документы S-1 всех компаний по приобретению специального назначения (SIC=6770), но у меня возникли проблемы с поиском эффективного способа получения этих данных от SEC EDGAR. Я изучил R-пакеты edgar и edgarWebR, но мне еще предстоит найти способ извлечения заявок S-1 для такого большого количества компаний только на основе их кода SIC. Я думаю, что если бы я мог получить коды CIK всех компаний, которые я ищу, я мог бы работать с существующими пакетами, чтобы получить необходимую мне информацию.

Если у кого-то есть опыт работы с edgar, какой пакет вы нашли полезным? Как я могу получить коды CIK для всей отрасли?


person jlis    schedule 24.04.2021    source источник
comment
Ваш вопрос, вероятно, получит больше ответов, если он будет сформулирован для решения вашей конкретной проблемы, а не для того, чтобы кто-то дал какое-то руководство.   -  person JohnH    schedule 25.04.2021
comment
@JohnH Спасибо за совет. Я все еще новичок в анализе данных и пытаюсь учиться, бросаясь вглубь. Я отредактировал пост, чтобы задать более точные вопросы.   -  person jlis    schedule 25.04.2021


Ответы (1)


Это не полный ответ, но он слишком длинный для комментария и, по крайней мере, поможет вам начать.

С той оговоркой, что я не знаком с R, вы можете начать с использования EDGAR API. Например, чтобы получить алфавитный список всех 237 заявок по форме S-1, поданных с начала года заявителями с 6770 SIC, вы можете использовать эту ссылку:

https://www.sec.gov/cgi-bin/srch-edgar?text=FORM-TYPE=S-1+and+ASSIGNED-SIC=6770+&first=2021&last=2021

Что вы будете делать с этим списком, когда получите его, — другой вопрос. Я знаю, что бы я сделал с этим, используя python, но для R вам понадобится помощь кого-то, более знакомого с инструментами на основе R.

Удачи - задача предстоит непростая...

person Jack Fleeting    schedule 26.04.2021
comment
Спасибо! В конце концов, я сделал что-то подобное, но с first=2003&last=2021, так как компания, которую я рассматриваю, существует только с 2003 года. Этот список был достаточно коротким, чтобы я мог просто вручную скопировать его в CSV-файл, который я мог использовать. в R, чтобы получить документы, которые я искал. - person jlis; 30.04.2021