Я знал, что Apache Flink имеет емкость «Ровно один раз», которая полагается на механизм контрольной точки и источник данных, подлежащих повторной отправке.
Насколько я понимаю, если оператор Flink получает некоторую ошибку, ему необходимо снова запустить свою последнюю операцию, поэтому ему необходимо получить исторические данные. В таком случае, где следует / можно хранить исторические данные?
Говоря, что источником данных является Apache Kafka, могу ли я позволить Kafka хранить исторические данные? Могу ли я позволить Flink хранить исторические данные? Или я могу позволить им обоим сделать это? Если они оба могут делать это вместе, означает ли это, что я могу позволить Kafka хранить одну часть исторических данных, а Flink - другую часть исторических данных, чтобы я мог сохранить больше исторических данных?