Я вижу несколько больших проблем с разработкой классификаторов нейронных сетей глубокого обучения (NN) с учителем. Точность классификации зависит от качества/качества размеченных данных и топологии сети.

Предварительно обученные веса могут значительно сократить время, необходимое для обучения сети. Тем не менее, проблемы могут быть устранены с сопоставлением предварительно обученных весов общедоступного домена при сопоставлении формы изображения/порядка тензоров в предварительно обученных весах с размером целевого изображения в обучающих/тестовых/проверочных наборах CNN.

1. Маркировка данных. Это трудоемкий процесс, который должен быть полуавтоматизирован. Моя компания частично автоматизирует процесс маркировки изображений продуктов. По нашим оценкам, полуавтоматическая система этикетирования позволяет сократить время на 2 порядка. Мы используем карту/уменьшение Hadoop и несколько веб-приложений для маркировки данных. Полуавтоматизация может быть применена ко многим различным задачам. Если кому-то нужно построить полуавтоматическую систему этикетирования для вашей компании, пожалуйста, свяжитесь со мной.

2. Топология нейронной сети (НС). Обучение сети с размеченными данными занимает много времени. Тестирование новых топологий NN требует переобучения новой NN с новой топологией.

3. Стоимость. Топовые графические процессоры стоят дорого. Мне сказали, что AWS взимает 7 долларов в час за машины с топовыми графическими процессорами (8 графических процессоров на машину — не уверен в розничной цене машины). Это ~$5k/мес. Протестируйте 20 различных комбинаций дизайна и учебных наборов в течение месяца, и вы сожжете 100 000 долларов на AWS.

Как всегда, исправления и комментарии приветствуются.