Публикации по теме 'fault-tolerance'
Реализация автоматического выключателя в Resilience4j
Это вторая статья из небольшой серии о библиотеке Resilience4j . Если вы не знакомы с самой библиотекой, сначала прочтите это . Кроме того, я хочу обсудить конкретные детали реализации шаблона выключателя внутри Resilience4j , поэтому, если этот шаблон для вас в новинку, ознакомьтесь с этой замечательной статьей об основной концепции, лежащей в основе него.
В настоящее время наиболее популярной реализацией автоматического выключателя на JVM является Hystrix , но, конечно, он..
Вопросы по теме 'fault-tolerance'
Что делать, если лидер выходит из строя в Multi-Paxos для систем master-slave?
Фон:
В разделе 3 под названием Реализация конечного автомата статьи Лампорта Paxos Made Simple , описывается Multi-Paxos. Multi-Paxos используется в Google Paxos Made Live . ( Multi-Paxos используется в Apache ZooKeeper ). В Multi-Paxos...
1567 просмотров
schedule
28.09.2021
Влияние коррелированных сбоев на производительность кластера
В нескольких презентациях (например, 1 , 2 , 3 ) при управлении кластером, одна из целей планировщика - уменьшить количество скоординированных сбоев путем распределения задач одного задания по вычислительным узлам, которые с меньшей вероятностью...
22 просмотров
schedule
21.11.2021
есть ли отказоустойчивый или свободный режим для @ babel / parser?
Меня интересует использование @ babel / parser для анализа исходного файла Javascript, который может содержать или не содержать синтаксические ошибки. acorn-loose - это вещь, а _ 2_ можно передать tolerant флаг со значением true ; есть ли...
103 просмотров
schedule
10.04.2022
Пожалуйста, помогите мне разработать эту систему отчетов о событиях
Я пытаюсь разработать систему, которая сообщает о событиях активности в базе данных через веб-службу. Веб-сервис и база данных уже созданы (программное обеспечение COTS) - все, что мне нужно сделать, это указать источник события.
Однако загвоздка...
155 просмотров
schedule
04.05.2022
Ровно-один раз: кто хранит исторические данные, флинк или источник данных
Я знал, что Apache Flink имеет емкость «Ровно один раз», которая полагается на механизм контрольной точки и источник данных, подлежащих повторной отправке.
Насколько я понимаю, если оператор Flink получает некоторую ошибку, ему необходимо снова...
123 просмотров
schedule
31.05.2022
WLPs Microprofile Fault Tolerance переборка не запускается
Попытка протестировать отказоустойчивость микропрофилей в WebSphere Liberty (WebSphere Application Server 18.0.0.3/wlp-1.0.22.cl180320180905-2337) на 64-разрядной серверной виртуальной машине Java HotSpot (TM), версия 1.8.0_161-b12 (en_US), но Я не...
70 просмотров
schedule
11.06.2022
Надежны ли сообщения Erlang/OTP? Могут ли сообщения дублироваться?
Длинная версия:
Я новичок в erlang и рассматриваю возможность его использования для масштабируемой архитектуры. Я нашел много сторонников платформы, рекламирующих ее надежность и отказоустойчивость.
Однако я изо всех сил пытаюсь понять, как...
7489 просмотров
schedule
30.10.2022
Автономный режим Flex AMF?
В настоящее время я использую Flex (Flash Builder 4) и устанавливаю подключения веб-службы к серверу Apache PHP Zend AMF для получения данных.
Это отлично работает, но мне интересно, какие варианты доступны для обеспечения отказоустойчивости.
Я...
152 просмотров
schedule
15.03.2023
если узел в хост-файле выходит из строя, как работать с остальными узлами кластера в программе MPI
если узел в хост-файле выходит из строя, как работать с остальными узлами с помощью MPI
197 просмотров
schedule
20.08.2023
Обработка ошибок в актерах Akka
У меня есть очень простой пример, когда у меня есть Актер ( SimpleActor ), который выполняет периодическую задачу, отправляя сообщение самому себе. Сообщение запланировано в конструкторе актора. В обычном случае (т.е. без сбоев) все работает...
6649 просмотров
schedule
11.02.2023
Восстановление после сбоя сервера HBase с помощью клиента Async HBase
В настоящее время я пытаюсь найти способ справиться с неожиданными сбоями HBase в моем приложении. Точнее, то, что я пытаюсь решить, — это случай, когда мое приложение вставляет данные в HBase, а затем HBase дает сбой и перезапускается.
Чтобы...
708 просмотров
schedule
02.02.2023
Как избежать потери внутреннего состояния мастера при переключении на новый мастер во время сетевого раздела
Я пытался реализовать простой один главный узел против системы с несколькими резервными узлами, чтобы узнать о распределенной и отказоустойчивой архитектуре.
На данный момент моя система выглядит так:
N разных узлов, каждый из которых...
29 просмотров
schedule
03.07.2023
Spark 2.4.0 отказоустойчивость структурированной потоковой передачи от Kafka
У меня возникают вопросы об отказоустойчивости в Spark Structured Streaming при чтении из kafka. Это из Руководства по программированию структурированной потоковой передачи:
В случае сбоя или преднамеренного завершения работы вы можете...
385 просмотров
schedule
13.04.2023
Как сделать надежный, масштабируемый Redis в Kubernetes
Я много искал, как развернуть Redis с высокой доступностью в kubernetes. У меня есть некоторые проблемы с использованием режима кластера Redis, и при использовании режима ведущий-ведомый нам также нужно развернуть сторожевой, чтобы иметь возможность...
1305 просмотров
schedule
25.04.2023
Функции Apache Flink с отслеживанием состояния пересылают одно и то же сообщение N функциям
Я пытаюсь отправить входящие сообщения нескольким функциям с отслеживанием состояния, но не могу полностью понять, как это сделать. Для простоты предположим, что одна из моих функций с отслеживанием состояния получает некоторые целые числа и...
147 просмотров
schedule
18.10.2022
Моделирование отказа узла в DHT
В настоящее время я провожу тестирование производительности бесплатного кондитерского DHT. Freepastry — это DHT с открытым исходным кодом, написанный на Java.
Цель состоит в том, чтобы отслеживать влияние на DHT, когда определенное количество...
563 просмотров
schedule
04.02.2024
Как каждая резервная копия / узел получает 2f ответов в PBFT?
В Практической византийской отказоустойчивости (PBFT) причина, по которой требуется 3f+1 , насколько я понимаю, заключается в том, чтобы учесть худший сценарий, когда:
1. f+1 nodes are normal
2. f nodes are unresponsive
3. f nodes are faulty...
207 просмотров
schedule
25.03.2024
Непонимание отказоустойчивости искры RDD
Многие говорят:
Spark не реплицирует данные в hdfs.
Spark упорядочивает операции в графе DAG. Spark строит линию RDD. Если RDD утерян, его можно восстановить с помощью графа происхождения. Таким образом, нет необходимости в репликации данных,...
436 просмотров
schedule
19.04.2024
Как мне автоматически восстановить дуплексный канал в случае неисправности?
Я разрабатываю клиент-серверное приложение в .Net 3.5 с использованием WCF. По сути, долго работающая клиентская служба (на нескольких машинах) устанавливает дуплексное соединение с сервером через netTcpBinding. Затем сервер использует контракт...
5619 просмотров
schedule
03.05.2024
Является ли аккордовый алгоритм отказоустойчивым?
Я смотрю на алгоритм хорды и не понимаю понять, как он претендует на отказоустойчивость.
Насколько я понимаю, данная пара ключ-значение хранится ровно на одном узле на основе алгоритма. Итак, мой вопрос: если этот узел выйдет из строя, как...
20 просмотров
schedule
04.05.2024