Интеграция/преобразование данных из разных/разрозненных источников без их сохранения

У меня есть вариант использования. Я хочу интегрировать/преобразовывать данные из разных/разрозненных источников без их сохранения. Источниками данных являются база данных (oracle, db2 и т. д.), веб-сервис (Rest/Soap), плоские файлы (CSV, XML, JSON), дампы MQ, системы мейнфреймов. Я хочу извлекать данные из этих источников, выполнять какое-то интеллектуальное преобразование и интеграцию и предоставлять их нашим клиентам. Это похоже на типичный сценарий ETL, но у меня другая ситуация. Мне не разрешено хранить данные, предоставленные отчаянными источниками, то есть, например, я беру данные из оракула, мыла и остальных, и делаю все свои интеллектуальные преобразования и интеграции на лету.

Я просмотрел Google и технические материалы, но не смог найти убедительного решения своей проблемы.

Если вы, ребята, можете помочь мне дать ценную информацию об этой проблеме и дать предложения и вероятные подходы к ней.

Примечание. Размер данных из этих источников иногда может быть очень большим.

Заранее спасибо


person Sadique    schedule 23.09.2017    source источник


Ответы (2)


Взгляните на http://teiid.org

Это именно то, что он делает, и это Open Source.

person Ramesh Reddy    schedule 23.09.2017
comment
Спасибо, Рамеш, за ваше предложение. Я уже просмотрел и сделал несколько тестов на JDV, используя teiid. Это действительно хороший инструмент. Но в некоторых сценариях он потерпел неудачу, например, когда у меня есть большие данные, сложная агрегация/объединение, когда сами данные действительно сложны (многоуровневые иерархические данные, в xml или Json) и проблемы с масштабируемостью инструмента . Если вы можете предложить какие-либо вспомогательные рекомендации для преодоления этого типичного сценария. - person Sadique; 27.09.2017
comment
Вам нужно будет предоставить подробную информацию о каждой проблеме, по которой вы не можете предложить какие-либо предложения. Teiid также поддерживает кластеризацию и кэширование для облегчения масштабирования. Предлагайте разные темы для каждой проблемы. - person Ramesh Reddy; 27.09.2017

Talend Open Studio также отличное решение, я использую его, и это здорово и легко сделать рабочий процесс ETL.

https://www.talend.com/products/data-integration/data-integration-manuals-release-notes/

Вы можете увидеть множество справочных видео: https://www.youtube.com/results?search_query=talend+studio

person marcode_ely    schedule 10.08.2018