Мне интересно, существует ли какой-либо случай или потребность в наличии нескольких типов нейронов, которые имеют разные функции активации друг для друга, смешанные в одном слое, и если да, то как реализовать это с помощью фреймворка Tensorflow Estimator.
Я могу придумать простой пример, для которого такая конфигурация может оказаться полезной.
Подумайте о попытке обучить нейронную сеть, которая может предсказать, находится ли любая заданная 2D-точка, имеющая значение координаты (x, y), внутри или за пределами данного круга, центр и радиус которого также определены в том же двухмерном простом пространстве.
Предположим, что центр нашего круга находится в точке (0,5, 0,5), а его радиус определен равным 0,5.
Стратегия нашего обучения может быть примерно такой: сначала генерировать множество точек случайным образом и судить о каждой точке, лежащей будь то внутри или снаружи круга, чтобы мы могли передать этот набор случайно сгенерированных координат в качестве объектов и результат внутреннего/внешнего суждения для каждого из них в качестве соответствующих меток.
Решение можно легко сделать, проверив формулу ниже:
(x-0,5)^2 + (y-0,5)^2 ‹ r^2
и это можно преобразовать следующим образом:
x^2 - х + у ^ 2 - у + 0,5 ‹ г ^ 2
Теперь, глядя на эту последнюю формулу, очевидно, что обучение могло бы стать эффективным, если бы сама нейронная сеть могла автоматически получать значения, такие как x ^ 2 и y ^ 2, просто из значения своего признака, которое задается как (x, y). Для этого я пришел к идее смешать такие нейроны, у которых f(x)=x^2 в качестве функции активации, среди стандартных нейронов ReLU.
Честно говоря, я уже сделал несколько тестовых реализаций этой проблемы с использованием фреймворка Tensorflow Estimator, и в одной из них я видел, что предоставление x^2 и y^2 в качестве дополнительных функций (всего 4 значения функций) должно способствовать эффективная сходимость обучения по сравнению со случаем с двумя признаками, но решение с использованием функции активации f(x)=x^2 показалось мне намного умнее.
И вот как я придумал свой вопрос здесь.
Надеюсь, что смогу услышать какое-либо мнение по этому поводу.
Спасибо.