Вопросы по теме 'data-ingestion'

Мне нужно получить последние данные в шаблоне приема данных nifi
Привет сэр, В шаблоне приема данных мне нужно получить это свойство, например, у меня есть данные с полем даты дата дата 12-07-2018 a 13-07-2018 b 14-07-2018 c 15-07-2018 d В этом случае я бы хотел взять последнюю версию, например,...
84 просмотров
schedule 06.10.2021

Невозможно обрезать пустое пространство в фрейме данных pyspark
При загрузке данных из Oracle и записи в PostgreSQL возникает странная проблема. Невозможно записать строку с пробелом в postgres. Столкнувшись с проблемой ниже Caused by: java.sql.BatchUpdateException: Batch entry 0 INSERT INTO...
86 просмотров

Потоковая аналитика Azure: как загрузить изображение в концентратор Azure в режиме реального времени из моей клиентской системы?
Я хочу непрерывно отправлять изображения из своей системы в облако Azure и обрабатывать изображение в облаке с помощью потоковой аналитики Azure. Ниже приведены мои требования: Непрерывно отправляйте изображения с клиента (мой рабочий стол) в...
145 просмотров

Загрузка данных csv в hadoop
В настоящее время я пытаюсь загрузить данные в hdfs. Тип данных, которые я пытался получить, — csv. Hadoop 3.1.1 установлен на Ubuntu. образец данных, хранящийся в /home/hadoop/test.csv Я пробовал источник1 hadoop@ambari:~$ hdfs dfs...
124 просмотров
schedule 27.08.2022

Работа с большими файлами с определенным расширением с помощью оператора сканирования каталогов
У меня есть файл размером более 1 ГБ, поступающий в мой каталог из MQ, для полной передачи файла требуется некоторое время, но файл будет создан в этом каталоге, даже если он не полный. Я боюсь, что мой оператор directoryScan обнаружит неполный файл....
63 просмотров
schedule 15.12.2022

Nifi- Процессор MergeContent- Mergestrategy
в чем разница между алгоритмом Bin Packing и стратегией слияния дефрагментации в процессоре слияния содержимого nifi любое сравнение относительно производительности
738 просмотров
schedule 06.06.2023

Сбой задания Sqoop через Dataproc
Я отправил задание Sqoop через GCP Dataproc Cluster и установил для него аргумент конфигурации --as-avrodatafile , но оно не работает со следующей ошибкой: /08/12 22:34:34 INFO impl.YarnClientImpl: Submitted application...
298 просмотров

Как постепенно загружать данные, используя Sqoop с Avro в качестве файла данных?
Получение ошибки ниже: --incremental lastmodified cannot be used in conjunction with --as-avrodatafile. при выполнении команды: gcloud dataproc jobs submit hadoop \ --project='aca-ingest-dev' \ --cluster='sqoop-gcp-ingest-d3' \...
248 просмотров

Apache Druid: проблема при обновлении данных в источнике данных
В настоящее время я использую версию druid-Incubating-0.16.0. Как указано в https://druid.apache.org/docs/latest/tutorials/tutorial-update-data.html , мы можем использовать объединение пожарных шлангов для обновления и объединения данных для...
524 просмотров
schedule 13.03.2023

Как получить данные из нескольких ресурсов с разной схемой
Мне нужно централизовать журналы из нескольких ресурсов с другой схемой Например Схема в source1: отметка времени, код ошибки, описание ошибки Схема в source2: отметка времени, идентификатор события, описание события Таблица создается как...
80 просмотров
schedule 21.04.2024

Nifi: проверьте CSV-файл на наличие обновлений строк, затем загрузите
Обычно в нашей среде, когда кто-то хочет принять новые данные, он генерирует новый файл CSV, который Nifi берет из SFTP. Однако у меня есть новый случай, когда исходный CSV-файл находится на общем диске, и их приложение добавляет к нему новые строки...
112 просмотров
schedule 14.05.2024