R - Построение модели автоэнкодера в Caret

Я хочу создать модель автоэнкодера с пакетом Caret со следующими функциями:

1) Создайте модель нейронной сети без учителя, используя автоэнкодеры глубокого обучения.

2) Использование модели автоэнкодера в (1) в качестве входных данных перед обучением для контролируемой модели.

Онлайн-примеры использования автоэнкодера в каретке довольно немногочисленны и далеки друг от друга, не предлагая реального понимания практических вариантов использования.

У меня ограничены ресурсы и конфиденциальность данных, поэтому я не могу использовать H2o или Keras для нейронных сетей.

Примеры данных для модели можно найти по адресу: https://www.kaggle.com/nodarokroshiashvili/credit-card-fraud/data

Пример этого в H2o находится по этой ссылке: https://shiring.github.io/machine_learning/2017/05/01/fraud

Любая помощь или указатели в правильном направлении в этом отношении будут оценены.

РЕДАКТИРОВАТЬ: Спасибо Лорен и Эрин, сотрудники H20, комментирующие, что конфиденциальность данных не должна вызывать беспокойства, потому что H20 создает кластер, который расположен локально, а не в «H20.cloud».


person user1783739    schedule 28.05.2018    source источник
comment
Нет проблем с конфиденциальностью ни с H2O, ни с Keras, а H2O будет намного эффективнее, чем курсор, поэтому я действительно не понимаю ограничений, которые вы устанавливаете. Если у вас ограниченные ресурсы, H2O определенно лучший вариант. Не могли бы вы объяснить свои опасения дальше?   -  person Erin LeDell    schedule 29.05.2018
comment
@ErinLeDell Проблемы конфиденциальности данных: данные, которые я использую, довольно конфиденциальны и не могут быть загружены в облако. Мой коллега и я разделились во мнениях относительно того, загружается ли H2O в облако, когда вы выполняете h2o.init (). Ограничения ресурсов: мы намерены встроить решение в сервер машинного обучения SQL, который в настоящее время принимает только R и python. Не знаю, как инициализировать H2O на сервере SQL. Пожалуйста, поясните, обоснованы ли наши опасения или возможные способы их решения.   -  person user1783739    schedule 29.05.2018
comment
Независимо от того, запускает ли h2o кластер локально или в облаке, вы полностью контролируете его. Прочтите следующие ресурсы документации по запуску h2o с помощью .init () docs.h2o.ai/h2o/latest-stable/h2o-r/docs/articles/, docs.h2o.ai/h2o/latest-stable/h2o-r/docs/reference / или с безопасностью: docs.h2o.ai / h2o / latest-stable / h2o-docs /.   -  person Lauren    schedule 29.05.2018
comment
@Lauren Спасибо за ссылки, они проливают свет на мои дебаты о безопасности / конфиденциальности данных. У вас есть предложения по использованию H2O в SQL-сервере для машинного обучения?   -  person user1783739    schedule 30.05.2018
comment
@ user1783739 вы можете найти информацию о реляционных базах данных здесь docs.h2o.ai/h2o/latest-stable/h2o-docs/. Если возможно, отредактируйте свое сообщение, если у вас больше нет проблем с конфиденциальностью в отношении H2O. Благодарность!   -  person Lauren    schedule 30.05.2018
comment
Не существует такого понятия, как облако H2O, принадлежащее H2O.ai, которое собирает данные о ваших тренировках. H2O можно использовать в сервисе облачных вычислений (например, AWS), но этот экземпляр будет контролироваться вами.   -  person Erin LeDell    schedule 30.05.2018
comment
@Lauren ссылка, которую вы отправили, предназначена специально для PostgreSQL и MySQL, какие-либо ссылки для сервера Microsoft SQL?   -  person user1783739    schedule 31.05.2018
comment
@Lauren Только что видел эту ссылку stackoverflow.com/questions/43851748/, мысли?   -  person user1783739    schedule 31.05.2018