Загрузка торрент-файла с помощью urllib2

Я пытаюсь скачать торрент-файлы с помощью urllib2, но выдает ошибку:

Traceback (most recent call last):
File "download_torrent.py", line 11, in <module>
  torr_file = urllib2.urlopen(url)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\urllib2.py", line 154, in urlopen
  return opener.open(url, data, timeout)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\urllib2.py", line 431, in open
  response = self._open(req, data)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\urllib2.py", line 449, in _open
  '_open', req)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\urllib2.py", line 409, in _call_chain
  result = func(*args)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\urllib2.py", line 1240, in https_open
  context=self._context)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\urllib2.py", line 1200, in do_open
  r = h.getresponse(buffering=True)
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\httplib.py", line 1132, in getresponse
  response.begin()
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\httplib.py", line 453, in begin
  version, status, reason = self._read_status()
File "C:\Users\Aly Akhtar\AppData\Local\Continuum\Anaconda\lib\httplib.py", line 417, in _read_status
  raise BadStatusLine(line)
httplib.BadStatusLine: '' 

Ниже приведен код, который я пытаюсь:

url = 'https://torcache.net/torrent/7E74F1E4AEDC08A2D63BE1EDF612AC0BF17ECBBD.torrent?title=[kat.cr]batman.v.superman.dawn.of.justice.2016.720p.hdtc.1.2gb.shaanig'
torr_file = urllib2.urlopen(url)
with open("mytorrent.torrent", "w") as f:
    f.write(torr_file.read())

Я прошел через несколько подобных вопросов, но не смог найти решение.


person Ronaldo    schedule 22.06.2016    source источник


Ответы (1)


Веб-сайт, с которого вы пытаетесь загрузить, похоже, отклоняет запросы без строки User-Agent в заголовке. Я нашел решение вашей проблемы здесь: https://stackoverflow.com/a/9265980/1577207.

Добавление заголовка User-Agent решает это для меня:

import urllib2
url = 'https://torcache.net/torrent/7E74F1E4AEDC08A2D63BE1EDF612AC0BF17ECBBD.torrent?title=[kat.cr]batman.v.superman.dawn.of.justice.2016.720p.hdtc.1.2gb.shaanig'

opener = urllib2.build_opener()

headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 5.1; rv:10.0.1) Gecko/20100101 Firefox/10.0.1',
}

opener.addheaders = headers.items()
torr_file = opener.open(url)
with open("mytorrent.torrent", "w") as f:
    f.write(torr_file.read())
person Jelle Besseling    schedule 22.06.2016
comment
хорошо, это решает мою вышеуказанную проблему, спасибо. Но теперь торрент-файл при открытии с помощью клиента выдает ошибку: торрент не является допустимым кодированием - person Ronaldo; 22.06.2016
comment
@AlyAkhtar Вы можете попробовать добавить параметр 'b' к open(), например: open(file, 'wb') для записи двоичного файла. - person Jelle Besseling; 24.06.2016