Я успешно установил оба H2O в своем кластере AWS Databricks, а затем успешно запустил сервер H2O с помощью:
h2o.init()
Когда я пытаюсь импортировать CSV-файл радужной оболочки, который хранится в моей DBFS Databricks:
train, valid = h2o.import_file(path="/FileStore/tables/iris.csv").split_frame(ratios=[0.7])
Я получаю H2OResponseError: ошибка сервера water.exceptions.H2ONotFoundArgumentException
Файл CSV абсолютно здесь; в той же записной книжке Databricks я могу читать его прямо в DataFrame и просматривать содержимое, используя тот же самый полный путь:
df_iris = ks.read_csv("/FileStore/tables/iris.csv")
df_iris.head()
Я также пробовал звонить:
h2o.upload_file("/FileStore/tables/iris.csv")
но безрезультатно; Я получаю H2OValueError: файла /FileStore/tables/iris.csv не существует. Я также пробовал загрузить файл прямо со своего локального компьютера (диск C), но это тоже не увенчалось успехом.
Я пробовал не использовать полный путь, а просто указывать имя файла, но получаю те же ошибки. Я прочитал документацию H2O и поискал в Интернете, но не могу найти никого, кто когда-либо сталкивался с этой проблемой раньше.
Кто-нибудь может мне помочь?
Спасибо.