Публикации по теме 'fault-tolerance'


Реализация автоматического выключателя в Resilience4j
Это вторая статья из небольшой серии о библиотеке Resilience4j . Если вы не знакомы с самой библиотекой, сначала прочтите это . Кроме того, я хочу обсудить конкретные детали реализации шаблона выключателя внутри Resilience4j , поэтому, если этот шаблон для вас в новинку, ознакомьтесь с этой замечательной статьей об основной концепции, лежащей в основе него. В настоящее время наиболее популярной реализацией автоматического выключателя на JVM является Hystrix , но, конечно, он..

Вопросы по теме 'fault-tolerance'

Что делать, если лидер выходит из строя в Multi-Paxos для систем master-slave?
Фон: В разделе 3 под названием Реализация конечного автомата статьи Лампорта Paxos Made Simple , описывается Multi-Paxos. Multi-Paxos используется в Google Paxos Made Live . ( Multi-Paxos используется в Apache ZooKeeper ). В Multi-Paxos...
1567 просмотров

Влияние коррелированных сбоев на производительность кластера
В нескольких презентациях (например, 1 , 2 , 3 ) при управлении кластером, одна из целей планировщика - уменьшить количество скоординированных сбоев путем распределения задач одного задания по вычислительным узлам, которые с меньшей вероятностью...
22 просмотров

есть ли отказоустойчивый или свободный режим для @ babel / parser?
Меня интересует использование @ babel / parser для анализа исходного файла Javascript, который может содержать или не содержать синтаксические ошибки. acorn-loose - это вещь, а _ 2_ можно передать tolerant флаг со значением true ; есть ли...
103 просмотров
schedule 10.04.2022

Пожалуйста, помогите мне разработать эту систему отчетов о событиях
Я пытаюсь разработать систему, которая сообщает о событиях активности в базе данных через веб-службу. Веб-сервис и база данных уже созданы (программное обеспечение COTS) - все, что мне нужно сделать, это указать источник события. Однако загвоздка...
155 просмотров
schedule 04.05.2022

Ровно-один раз: кто хранит исторические данные, флинк или источник данных
Я знал, что Apache Flink имеет емкость «Ровно один раз», которая полагается на механизм контрольной точки и источник данных, подлежащих повторной отправке. Насколько я понимаю, если оператор Flink получает некоторую ошибку, ему необходимо снова...
123 просмотров

WLPs Microprofile Fault Tolerance переборка не запускается
Попытка протестировать отказоустойчивость микропрофилей в WebSphere Liberty (WebSphere Application Server 18.0.0.3/wlp-1.0.22.cl180320180905-2337) на 64-разрядной серверной виртуальной машине Java HotSpot (TM), версия 1.8.0_161-b12 (en_US), но Я не...
70 просмотров

Надежны ли сообщения Erlang/OTP? Могут ли сообщения дублироваться?
Длинная версия: Я новичок в erlang и рассматриваю возможность его использования для масштабируемой архитектуры. Я нашел много сторонников платформы, рекламирующих ее надежность и отказоустойчивость. Однако я изо всех сил пытаюсь понять, как...
7489 просмотров

Автономный режим Flex AMF?
В настоящее время я использую Flex (Flash Builder 4) и устанавливаю подключения веб-службы к серверу Apache PHP Zend AMF для получения данных. Это отлично работает, но мне интересно, какие варианты доступны для обеспечения отказоустойчивости. Я...
152 просмотров

если узел в хост-файле выходит из строя, как работать с остальными узлами кластера в программе MPI
если узел в хост-файле выходит из строя, как работать с остальными узлами с помощью MPI
197 просмотров
schedule 20.08.2023

Обработка ошибок в актерах Akka
У меня есть очень простой пример, когда у меня есть Актер ( SimpleActor ), который выполняет периодическую задачу, отправляя сообщение самому себе. Сообщение запланировано в конструкторе актора. В обычном случае (т.е. без сбоев) все работает...
6649 просмотров
schedule 11.02.2023

Восстановление после сбоя сервера HBase с помощью клиента Async HBase
В настоящее время я пытаюсь найти способ справиться с неожиданными сбоями HBase в моем приложении. Точнее, то, что я пытаюсь решить, — это случай, когда мое приложение вставляет данные в HBase, а затем HBase дает сбой и перезапускается. Чтобы...
708 просмотров
schedule 02.02.2023

Как избежать потери внутреннего состояния мастера при переключении на новый мастер во время сетевого раздела
Я пытался реализовать простой один главный узел против системы с несколькими резервными узлами, чтобы узнать о распределенной и отказоустойчивой архитектуре. На данный момент моя система выглядит так: N разных узлов, каждый из которых...
29 просмотров

Spark 2.4.0 отказоустойчивость структурированной потоковой передачи от Kafka
У меня возникают вопросы об отказоустойчивости в Spark Structured Streaming при чтении из kafka. Это из Руководства по программированию структурированной потоковой передачи: В случае сбоя или преднамеренного завершения работы вы можете...
385 просмотров

Как сделать надежный, масштабируемый Redis в Kubernetes
Я много искал, как развернуть Redis с высокой доступностью в kubernetes. У меня есть некоторые проблемы с использованием режима кластера Redis, и при использовании режима ведущий-ведомый нам также нужно развернуть сторожевой, чтобы иметь возможность...
1305 просмотров

Функции Apache Flink с отслеживанием состояния пересылают одно и то же сообщение N функциям
Я пытаюсь отправить входящие сообщения нескольким функциям с отслеживанием состояния, но не могу полностью понять, как это сделать. Для простоты предположим, что одна из моих функций с отслеживанием состояния получает некоторые целые числа и...
147 просмотров

Моделирование отказа узла в DHT
В настоящее время я провожу тестирование производительности бесплатного кондитерского DHT. Freepastry — это DHT с открытым исходным кодом, написанный на Java. Цель состоит в том, чтобы отслеживать влияние на DHT, когда определенное количество...
563 просмотров

Как каждая резервная копия / узел получает 2f ответов в PBFT?
В Практической византийской отказоустойчивости (PBFT) причина, по которой требуется 3f+1 , насколько я понимаю, заключается в том, чтобы учесть худший сценарий, когда: 1. f+1 nodes are normal 2. f nodes are unresponsive 3. f nodes are faulty...
207 просмотров

Непонимание отказоустойчивости искры RDD
Многие говорят: Spark не реплицирует данные в hdfs. Spark упорядочивает операции в графе DAG. Spark строит линию RDD. Если RDD утерян, его можно восстановить с помощью графа происхождения. Таким образом, нет необходимости в репликации данных,...
436 просмотров

Как мне автоматически восстановить дуплексный канал в случае неисправности?
Я разрабатываю клиент-серверное приложение в .Net 3.5 с использованием WCF. По сути, долго работающая клиентская служба (на нескольких машинах) устанавливает дуплексное соединение с сервером через netTcpBinding. Затем сервер использует контракт...
5619 просмотров
schedule 03.05.2024

Является ли аккордовый алгоритм отказоустойчивым?
Я смотрю на алгоритм хорды и не понимаю понять, как он претендует на отказоустойчивость. Насколько я понимаю, данная пара ключ-значение хранится ровно на одном узле на основе алгоритма. Итак, мой вопрос: если этот узел выйдет из строя, как...
20 просмотров