this_page = read_html("https://apu.edu/athletics")
> this_page
{xml_document}
<html id="ctl00_html" lang="en" class=" index homepage">
[1] <head>\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">\n<script>window.client_hostname = "athletics.apu.edu";window.server_name = "79077 ...
[2] <body>\n<div style="position: fixed; left: -10000px"><script src="//cdn.blueconic.net/azusa.js" async=""></script></div>\n<script>(function(i,s,o,g,r,a,m){i[ ...
хотя мы читаем https://apu.edu/athletics
, он перенаправляет на athletics.apu.edu
. Это верно как в браузере, так и в выводе this_page
прямо здесь: <script>window.client_hostname = "athletics.apu.edu"; ...
Можно ли извлечь это значение из переменной this_page
?
Изменить: все три лучших в настоящее время ответа (экоам, Дэвид, Аллан) работают, и все они занимают примерно одинаковое время (0,35 секунды). Я принял ответ с trace_redirects
, потому что он предоставляет дополнительную информацию обо всех перенаправлениях ...
rvest
сможет это сделать. Это должно быть возможно при использованииselenium
, см. это для начиная. - person David   schedule 30.09.2020read_html("https://athletics.apu.edu")
? - person ekoam   schedule 30.09.2020apu.edu/athletics
предоставляется, аathletics.apu.edu
- нет. - person Canovice   schedule 30.09.2020