Я пытаюсь загрузить PDF-файл из Национального информационного центра через RCurl
, но у меня возникли проблемы. Для этого примера URL я хочу, чтобы PDF-файл соответствовал к настройкам по умолчанию, за исключением «Формат отчета», который должен быть «PDF». Когда я запускаю следующий сценарий, он сохраняет файл, связанный с выбором других кнопок («Родитель(и) ...»/HMDA — не по умолчанию). Я попытался добавить эти элементы ввода в params
, но это ничего не изменило. Может ли кто-нибудь помочь мне определить проблему? Благодарю.
library(RCurl)
curl = getCurlHandle()
curlSetOpt(cookiejar = 'cookies.txt', curl = curl)
params = list(rbRptFormatPDF = 'rbRptFormatPDF')
url = 'https://www.ffiec.gov/nicpubweb/nicweb/OrgHierarchySearchForm.aspx?parID_RSSD=2162966&parDT_END=99991231'
html = getURL(url, curl = curl)
viewstate = sub('.*id="__VIEWSTATE" value="([0-9a-zA-Z+/=]*).*', '\\1', html)
event = sub('.*id="__EVENTVALIDATION" value="([0-9a-zA-Z+/=]*).*', '\\1', html)
params[['__VIEWSTATE']] = viewstate
params[['__EVENTVALIDATION']] = event
params[['btnSubmit']] = 'Submit'
result = postForm(url, .params=params, curl=curl, style='POST')
writeBin( as.vector(result), 'test.pdf')