Вопросы по теме 'flink-batch'
Не работает выходной аккумулятор пакетной программы Flink
ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();
......
JobExecutionResult jobExecutionResult = env.execute(XXXOffline.class.getName());
int records =...
119 просмотров
schedule
26.09.2021
Определенная с помощью использования агрегатная функция во Flink - не найдено совпадений для сигнатуры функции
Я хотел бы сохранить все необработанные строки для каждого ключа в запросе Select .. From .. GROUP BY .. во Flink. Я определил AggregateFunction под названием RowToJsonAgg, который объединяет строки в строку Json.
class RowToJsonAgg extends...
146 просмотров
schedule
09.11.2021
Как Flinks Collector.collect () обрабатывает данные?
Я пытаюсь понять, что делает Flinks Collector.collect () и как он обрабатывает входящие / исходящие данные:
Пример взят из Flink DataSet API:
Следующий код преобразует DataSet текстовых строк в DataSet слов:
DataSet<String> output =...
113 просмотров
schedule
03.12.2021
FLINK - как обрабатывать логику результата sql-запроса
Мое требование - обработать или построить некоторую логику вокруг результата запроса sql во flink. Для простоты скажем, что у меня есть два sql-запроса, которые они выполняют с разным размером окна и один поток событий. У меня вопрос
а) как я...
142 просмотров
schedule
18.02.2022
Сортировка набора данных Flink на основе нескольких селекторов ключей
Я хочу отсортировать POJO DataSet на основе нескольких значений с помощью нескольких функций KeySelector:
DataSet<PoJo> data = input
.sortPartition(new KeySelector<PoJo, Integer>() {
public Integer...
60 просмотров
schedule
20.02.2022
Набор данных flink 1.7.2 не поддерживает приемник кафка?
Набор данных flink 1.7.2 не поддерживает приемник кафка?
После выполнения пакетной операции мне нужно опубликовать сообщение в kafka, то есть источник - мой postgres, а приемник - моя kafka.
Является ли это возможным ?
244 просмотров
schedule
05.03.2022
Как изменить количество разделов по умолчанию в Flink DataSet?
Вот требование: набор данных слишком велик, нам нужно разделить данные, вычислить локальный результат в каждом разделе, а затем объединить. Например, если имеется 1 миллион фрагментов данных, разделенных на 100 разделов, каждая копия будет содержать...
39 просмотров
schedule
23.03.2022
Apache Flink - API набора данных - Дополнительные выходы
Поддерживает ли Flink функцию бокового вывода в наборе данных (пакетный API)? Если нет, как обрабатывать действительные и недействительные записи при загрузке из файла?
160 просмотров
schedule
29.03.2022
Равномерно распределяйте слоты задач между менеджерами задач flink
У меня есть задание flink (2 диспетчера задач) с параллелизмом заданий 64 и слотом задач 64.
У меня для одного из операторов установлено значение параллелизма 16. Слоты этого оператора (16 параллелизма) не распределяются равномерно между двумя...
40 просмотров
schedule
24.04.2022
Могу ли я открыть конечную точку из моего потокового приложения flink?
Я хотел бы предоставить конечную точку из моего потокового приложения flink. Которое возвращает некоторые статические метаданные о приложении. Каковы возможные пути реализации этого. Пожалуйста помоги
33 просмотров
schedule
31.07.2022
Может ли в любом случае преобразование набора данных-: Distinct() использоваться в потоке данных во Flink?
Мне было интересно, можно ли в любом случае использовать API потока данных Flink для удаления дубликатов из поступающих записей (может быть в течение определенного временного окна), как в API набора данных, который обеспечивает преобразование под...
51 просмотров
schedule
15.10.2022
Flink пересылать файлы из List‹String› filePaths
У нас есть список путей к файлам из таблицы БД с отметкой времени ее создания. Попытка выяснить, как мы можем использовать список путей к файлам из db для пересылки только тех файлов из nfs в приемник kafka.
Прямо сейчас я использую настраиваемую...
25 просмотров
schedule
19.01.2023
Режим Flink yarn-session становится нестабильным при одновременном выполнении ~ 10 пакетных заданий
Я пытаюсь настроить сеанс flink-yarn для запуска более 100 пакетных заданий. После подключения к ~ 40 диспетчерам задач и ~ 10 запущенным заданиям (каждый диспетчер задач с 2 слотами и 1 ГБ памяти каждый), похоже, сеанс становится нестабильным....
67 просмотров
schedule
07.08.2023
Установите режим отсоединения Flink с помощью Java
Сведения о кластере Flink, Количество узлов : 4 Версия Flink : 1.11 Клиент Flink : RestCluserClient
Мы отправляем пакетное задание Flink из потокового задания с помощью PackagedProgram, но наше требование состоит в том, чтобы выполнять...
74 просмотров
schedule
28.01.2024
Проблема с использованием функции collect() DataSet в apache flink
Я пытаюсь рассчитать индекс отношений AdamicAdar в следующем графике социальных сетей. Я настроил свои ребра, вершины, набор данных и график, используя библиотеку apache flink-gelly. Вот мой код:
import...
220 просмотров
schedule
20.05.2024