У нас есть несколько скриптов на Python, которые очищают веб-сайты и хорошо работают. Теперь мы хотим сделать это в Azure Databricks. Мы думали, что у нас есть решение сделать это в следующем сообщении на форуме Databricks, но, к сожалению, это не работает. (https://forums.databricks.com/questions/15480/how-to-add-webdriver-for-selenium-in-databricks.html?childToView=21347#answer-21347)
Ошибка, которую мы получаем после запуска последнего бита кода: WebDriverException: сообщение: неизвестная ошибка: не удается найти двоичный файл Chrome (информация о драйвере: chromedriver = 73.0.3683.68 (47787ec04b6e38e22703e856e101e840b65afe72), platform = Linux 4.15.0-1050-azure x86_64)
Последний фрагмент кода выглядит так:
%py
from selenium import webdriver
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-dev-shm-usage')
chrome_driver = "/tmp/chromedriver/chromedriver"
driver = webdriver.Chrome(chrome_driver,
chrome_options=chrome_options)
driver.get("https://www.google.com")
Я нашел сообщение, в котором мне нужно указать расположение двоичного файла: Selenium дает selenium.common.exceptions.WebDriverException: сообщение: неизвестная ошибка: не удается найти двоичный файл Chrome на Mac
options.binary_location = "/Applications/Google
Chrome.app/Contents/MacOS/Google Chrome"
Но я не знаю, где находится этот двоичный файл в Azure Databricks.