Искусственный интеллект

Понимание предвзятости самым простым правдоподобным образом

Недавно я начал изучать нейронные сети и наткнулся на термин «функция активации» и «предубеждения». Функция активации имела для меня некоторый смысл, но мне было трудно понять точную суть предвзятости в нейронной сети.

Я исследовал различные источники, и все, что у них было, было -

Смещение в нейронных сетях можно рассматривать как аналог роли перехвата в линейной регрессии.

Но что, черт возьми, это значит? Я очень хорошо понимаю, что перехват - это точка, в которой линия пересекает ось y. И если у нас нет точки перехвата, наша линия всегда будет проходить через начало координат, но в реальном мире дела обстоят не так, поэтому мы используем перехват, чтобы добавить некоторую гибкость.

Итак, как предубеждения добавляют гибкости нейронным сетям?

Вы найдете ответ на этот вопрос в конце этой статьи.

Приведенное выше определение - наиболее распространенное определение, с которым мы сталкиваемся, когда говорим о предвзятости. Поэтому я подумал, что давайте проигнорируем мой вышеупомянутый вопрос и продолжим это посредственное объяснение предвзятости (которое не имеет никакого смысла). Потому что кто угодно, это сфабрикованный ответ людей на вопрос о предвзятости. Но потом я наткнулся на это изображение ниже, и оно меня сильно задело.

Если я не могу объяснить предубеждения шестилетнему ребенку, значит, я полагаю, что даже я этого не понял (что действительно является правдой). Так что я начал изучать еще несколько ресурсов, и, наконец, предубеждения начали обретать смысл. Давайте разберемся в предвзятости с помощью перцептрона.

Перцептрон

Персептрон можно представить как нечто, принимающее некоторый набор двоичных входов x1, x2,… и производящее единственный двоичный выход.

Веса соответствуют важности входов, характеристик AKA. Выходные данные, т.е. 0 или 1, зависят от того, превышает ли взвешенная сумма весов и входных данных некоторый порог.

Математически

Давайте рассмотрим пример. Предположим, вам нравится человек, и вы хотите решить, стоит ли вам рассказывать этому человеку о своих чувствах. Вы можете прийти к окончательному решению в зависимости от следующих вопросов.

  1. Действительно ли я люблю этого человека или это просто страсть?
  2. Что, если я скажу от всего сердца, это разрушит мое уравнение с этим человеком?
  3. Стоит ли с этим (будет ли это иметь негативные последствия для вашей карьеры)

Я знаю, что может быть много других вопросов, но это общие. Итак, ваше решение, говорить ли вам от души, зависит от приведенных выше вопросов.

Итак, давайте рассмотрим x1, x2 и x3 как ваши 3 вопроса, и x1 = 0, если это увлечение, и x1 = 1, если это не так. Точно так же x2 = 0, если это не испортит ваше уравнение, и x3 = 0, если вы чувствуете, что оно того не стоит.

Может так случиться, что не все вышеперечисленные вопросы имеют одинаковую важность. Что вы можете сделать, так это присвоить всем вопросам номера в зависимости от их важности / актуальности. Эти числа - не что иное, как вес.

Предположим, вы назначаете веса, w1 = 3, w2 = 2, w3 = 7, где w1, w2, w3 представляют веса для вопросов 1, 2 и 3 соответственно. Это означает, что вы больше беспокоитесь о том, стоит ли оно того, поскольку вы хотите сосредоточиться на своей карьере, и вы не можете позволить себе отвлекаться (поскольку w3 имеет большее значение). Вы устанавливаете порог равным 6, поэтому, если взвешенная сумма окажется больше 6, вы скажете от всей души. Но из приведенных выше значений веса видно, что вы не беспокоитесь о том, увлеченность это или нет, и не испортит ли это вещи, потому что даже если x1 = 1, x2 = 1, это не будет иметь большого значения. Ваше решение, так как их вес меньше. Итак, глядя на порог и w3, мы можем сказать, что решающим фактором является x3 (вопрос 3).

Давайте рассмотрим другой сценарий, представьте, что веса будут w1 = 10, w2 = 3, w3 = 5. Итак, здесь важнее, увлечение это или нет. И предположим, что теперь вы сохраняете порог на низком уровне, равном 2, чтобы вы могли довольно быстро принять решение «Да». Скажем, x1 = 0, x2 = 1, x3 = 0. В этом случае взвешенная сумма больше порога, даже когда x1 и x3 равны 0. Таким образом, даже если x1 имел больший вес, но не играл роль решающий фактор, поскольку порог был слишком низким. Это означает, что вы с большим желанием выскажете свое сердце, установив более низкий порог.

Таким образом, изменение весов и пороговых значений также меняет решение.

Представьте себе случай, когда у нас нет порогового значения, поэтому вы получите ответ «Да», как только взвешенная сумма будет больше 0. Но мы не хотим, чтобы это произошло. Мы хотим прийти к выводу в зависимости от величины взвешенной суммы. Если взвешенная сумма превышает определенный порог, только тогда выход должен быть Да, иначе должен быть Нет. Следовательно, нам нужен порог.

Упростим уравнение, перенеся порог в левую часть.

Точно так же мы хотим, чтобы наш нейрон активировался, когда наша взвешенная сумма превышает определенный порог. Если мы не используем порог, нейрон активируется, как только взвешенная сумма будет больше 0.

Итак, смещаем b = −threshold и используем смещение вместо порога, мы получаем знакомое уравнение.

Здесь Σwixi записывается как w.x = Σwixi, где w и x - векторы, компоненты которых являются весами и входами, соответственно.

Мы можем думать, что смещение используется для бездействия, нейрон будет активирован только в том случае, если взвешенная сумма больше порогового значения, как b = −threshold концепции немного поменялись местами. Ранее мы говорили, что чем больше порог, тем больше должна быть взвешенная сумма активируемого нейрона, но теперь, поскольку смещение представляет собой отрицание порога, большее смещение меньше взвешенной суммы, необходимой для активации нейрона.

Таким образом, предвзятость добавляет гибкости нейронной сети, решая, когда должен активироваться нейрон.

Очевидно, что перцептрон не совсем похож на то, как люди принимают сложные решения, но этот пример помогает проще понять предубеждения.

Надеюсь, я объяснил, что такое предвзятость, самым простым и правдоподобным образом. Не стесняйтесь оставлять комментарии или вопросы ниже, вы можете найти меня в Linkedin.