У нас есть кластер Hortonwork HDP 2.3 с 4 узлами, управляемый Ambari 2.1, работающий на Ubuntu 14.04. Все идет нормально. Мы можем запускать некоторые задания на Pig, Kafka, Spark и т. Д. Мне просто интересно: есть ли способ сделать нашу систему отказоустойчивой? Например. в случае отказа Ambari Server весь кластер становится неуправляемым.
Возможно ли иметь какой-то «резервный» сервер, чтобы иметь возможность автоматически определять, что основной сервер выходит из строя, и этот резервный сервер может забирать все выполняемые в данный момент задания и службы и становиться «основным» главным сервером без потери заданий ?! ? Это не проблема с подчиненными узлами, через пользовательский интерфейс Ambari мы можем легко управлять хостами (добавлять / удалять) и видеть текущее состояние каждого из них. Но вопрос в том, что если главный узел выйдет из строя.
Мы новички в мире HDP и unix. Проведя исследование, я нашел только одну статью здесь, но Статус статья - «Открытая», а Решение - «Нерешенное». Кто-нибудь здесь сталкивался с такими же проблемами и может предоставить какое-то решение или указать мне правильное направление, или, может быть, он все еще не поддерживается и является одной из функций «скоро»?