У меня проблема с настройкой GCP AI Platform Pipelines - Kubeflow Pipelines v1.4.1 с использованием управляемого хранилища Ни одна конфигурация не позволяет мне (ошибки в службе KFP) использовать использование управляемого хранилища, но позвольте сосредоточиться на конкретном, описанном ниже.
Моя установка:
- частный кластер с версией 1.17.15-gke.800 в настраиваемой сети / подсети и включенной идентификации рабочей нагрузки
- частный mysql 8.0 в той же настраиваемой сети / подсети, что и GKE
- GCS
- Использовать управляемое хранилище, где указана вся необходимая информация: имя GCS, имя подключения для БД, пользователь, пароль и префикс БД.
- идентификация рабочей нагрузки (для упрощения всех KSA (учетная запись службы K8s) была сопоставлена с одной учетной записью службы Google с ролью владельца)
Имейте в виду, что установка с GKE и KFP отлично работает без опции Использовать управляемое хранилище, но в случае использования Использовать управляемое хранилище она не работает:
- мл-трубопровод:
- status:
- Pod errors: CrashLoopBackOff
- Нет минимальной доступности
- журналы:
packets.go:36: unexpected EOF
CETdriver: bad connection
- метаданные-grpc-развертывание:
- status:
- Pod errors: CrashLoopBackOff
- Нет минимальной доступности
- журналы:
Non-OK-status: status status: Internal: mysql_real_connect failed: errno: 2013, error: Lost connection to MySQL server at 'handshake: reading inital communication packet', system error: 11MetadataStore cannot be created with the given connection config.
- cloudsqlproxy и mysql (те же журналы):
- статус: хорошо
- журналы:
couldn't connect to "<db_connection_string>": googleapi: Error 401: Request had invalid authentication credentials. Expected OAuth 2 access token, login cookie or other valid authentication credential. See https://developers.google.com/identity/sign-in/web/devconsole-project.
More details:
Reason: authError, Message: Invalid Credentials
Похоже, что есть проблема в сервисе / модуле cloudqlproxy, который не может установить соединение с БД. Это ошибка в этой функции или неправильная конфигурация?