Вызов

Одной из самых больших проблем для бизнеса является наличие множества бизнес-систем, таких как SAP, Sales Force, бизнес-системы Oracle и многое другое. Наиболее распространенными являются SAP и отдел продаж, но идея здесь заключается в создании озера данных, независимого от любых бизнес-систем, поскольку оно обеспечивает большую ценность для бизнеса, поскольку их аналитика не связана с продуктом.

Также предоставьте масштабируемые и основанные на стоимости системы. Другая проблема для машинного обучения/глубокого обучения заключается в возможности использовать другие внешние источники данных, такие как Twitter, Facebook или любые социальные платформы с погодными и экономическими данными, а также источники данных других поставщиков данных. Интеграция этого в SAP и отдел продаж является сложным и трудоемким процессом. Также он должен соответствовать схеме исходных систем и другим ограничениям, которые может иметь платформа. Например, текст может быть обрезан, дата может иметь определенный формат и т. д.

Решение

Чтобы решить вышеуказанную проблему, мы можем взглянуть с другой точки зрения и посмотреть, как мы можем этого достичь. Архитектура не в реальном времени, но мы можем сделать это в реальном времени. Есть несколько проблем, которые решает эта архитектура.

  • Перенос данных из SAP — сбор данных пакетами и изменениями
  • Перенос данных из устаревших и других бизнес-систем

Перенос данных из SAP и устаревших систем является более обременительным, трудоемким и дорогостоящим. Используя Velocity от Kagool, мы можем перемещать фактические бизнес-данные из ECC, BW и HANA в хранилище озера данных Azure. Для пользователей, у которых есть SAP ECC, может быть легко переместить данные из ECC в озеро данных Azure вместо HANA, поскольку для HANA это дорого.

Мало того, что системы SAP HANA не предоставляют возможности выбора платформы машинного обучения или глубокого обучения, как это делает Машинное обучение Azure. Продукты машинного обучения Azure предоставляют доступ к программированию на основе Python и R, а также позволяют нам использовать Tensorflow, pytorch и другие языки программирования с открытым исходным кодом, сохраняя при этом жизненный цикл науки о данных от начала до конца.

Первоначально опубликовано на https://github.com.