Я решил добавить графический интерфейс в один из своих скриптов. Скрипт представляет собой простой веб-скребок. Я решил использовать рабочий поток, так как загрузка и анализ данных может занять некоторое время. Я решил использовать PySide, но мои познания в Qt в целом весьма ограничены.
Поскольку сценарий должен ждать ввода данных пользователем при обнаружении капчи, я решил, что он должен ждать, пока QLineEdit
не сработает returnPressed
, а затем отправить его содержимое в рабочий поток, чтобы он мог отправить его для проверки. Это должно быть лучше, чем ожидание нажатия клавиши возврата.
Кажется, что ожидание сигнала не так просто, как я думал, и после некоторого поиска я наткнулся на несколько решений, похожих на это. Однако сигнализация между потоками и локальный цикл обработки событий в рабочем потоке делают мое решение немного более сложным.
После того, как возился с ним в течение нескольких часов, он все еще не будет работать.
Что должно произойти:
- Загрузить данные до указанной капчи и войти в цикл
- Загрузите капчу и отобразите ее пользователю, запустите
QEventLoop
по телефонуself.loop.exec_()
- Выйдите из
QEventLoop
, вызвавloop.quit()
в слоте рабочих потоков, который подключен черезself.line_edit.returnPressed.connect(self.worker.stop_waiting)
в классеmain_window
- Подтвердите капчу и выполните цикл, если проверка не удалась, в противном случае повторите попытку с последнего URL-адреса, который должен быть загружен сейчас, а затем перейдите к следующему URL-адресу.
Что случается:
...см. выше...
Выход из
QEventLoop
не работает.self.loop.isRunning()
возвращаетFalse
после вызоваexit()
.self.isRunning
возвращаетTrue
, поэтому поток, похоже, не умер при странных обстоятельствах. Тем не менее поток останавливается на строкеself.loop.exec_()
. Таким образом, поток застрял, выполняя цикл событий, хотя цикл событий говорит мне, что он больше не работает.GUI отвечает так же, как и слоты класса рабочего потока. Я вижу текст, отправляемый в рабочий поток, статус цикла событий и сам поток, но ничего после выполнения вышеупомянутой строки.
Код немного запутан, поэтому я добавляю немного псевдокода-питона-микса, опуская неважное:
class MainWindow(...):
# couldn't find a way to send the text with the returnPressed signal, so I
# added a helper signal, seems to work though. Doesn't work in the
# constructor, might be a PySide bug?
helper_signal = PySide.QtCore.Signal(str)
def __init__(self):
# ...setup...
self.worker = WorkerThread()
self.line_edit.returnPressed.connect(self.helper_slot)
self.helper_signal.connect(self.worker.stop_waiting)
@PySide.QtCore.Slot()
def helper_slot(self):
self.helper_signal.emit(self.line_edit.text())
class WorkerThread(PySide.QtCore.QThread):
wait_for_input = PySide.QtCore.QEventLoop()
def run(self):
# ...download stuff...
for url in list_of_stuff:
self.results.append(get(url))
@PySide.QtCore.Slot(str)
def stop_waiting(self, text):
self.solution = text
# this definitely gets executed upon pressing return
self.wait_for_input.exit()
# a wrapper for requests.get to handle captcha
def get(self, *args, **kwargs):
result = requests.get(*args, **kwargs)
while result.history: # redirect means captcha
# ...parse and extract captcha...
# ...display captcha to user via not shown signals to main thread...
# wait until stop_waiting stops this event loop and as such the user
# has entered something as a solution
self.wait_for_input.exec_()
# ...this part never get's executed, unless I remove the event
# loop...
post = { # ...whatever data necessary plus solution... }
# send the solution
result = requests.post('http://foo.foo/captcha_url'), data=post)
# no captcha was there, return result
return result
frame = MainWindow()
frame.show()
frame.worker.start()
app.exec_()