Методы с открытым исходным кодом для блокировки доступа ботов на основе Selenium к веб-сайтам

Я запускаю сайт, который может привлечь много внимания из-за троллинга ботов в комментариях или по электронной почте.

Одним из наиболее распространенных фреймворков для ботов является Selenium.

Как мне обнаружить и заблокировать ботов на основе Selenium? Я бы предпочел фреймворки с открытым исходным кодом, чтобы можно было обновлять код в режиме реального времени. Сайт в основном использует JavaScript, HTML5 и CSS, размещенный на Apache.


person Kevin    schedule 25.06.2020    source источник


Ответы (2)


Требование Google recaptcha перед отправкой комментария или электронного письма будет очень эффективным.

https://www.google.com/recaptcha/intro/v3.html

person Jortega    schedule 25.06.2020

Вы все правильно поняли. В наши дни одна из самых распространенных и популярных структур bot основаны на Selenium, управляемом WebDriver.

Однако управляемые Selenium WebDriver, управляемые контекстами просмотра, легко обнаружить, и корректирующие меры могут быть реализованы различными способами следующим образом:

  • Внедрение captcha / recaptcha для обнаружения автоматических ботов.

Вы можете найти соответствующее подробное обсуждение в Каким образом recaptcha 3 знаете, что я использую селен / хромированный драйвер?

  • Обнаружение термина HeadlessChrome в Headless Chrome UserAgent

Вы можете найти соответствующее подробное обсуждение в Доступ к странице запрещен в Chrome без заголовка в Linux, в то время как Chrome с заголовком работает в Windows с использованием Selenium через Python

  • Использование службы управления ботами от Distil Networks

Вы можете найти соответствующее подробное обсуждение в Невозможно использовать Selenium для автоматизации входа на сайт Chase

  • Использование службы диспетчера ботов от Акамай

Вы можете найти соответствующее подробное обсуждение в https://stackoverflow.com/questions/62457093/dynamic-dropdown-doesnt-populate-with-auto-suggestions-on-https-www-nseindia/62457673#62457673

  • Использование службы защиты от ботов из Datadome

Вы можете найти соответствующее подробное обсуждение в Веб-сайт, использующий DataDome, блокирует капчу при парсинге с использованием Selenium и Python


использованная литература

Вы можете найти соответствующие обсуждения в:

person DebanjanB    schedule 25.06.2020