ЧТО ПОНИМАЕТСЯ ПОД КИБЕРПРЕСТУПНОСТЬЮ?

Киберпреступность, также называемая компьютерной преступностью, использование компьютера в качестве инструмента для достижения незаконных целей, таких как совершение мошенничества, кража личных данных или нарушение конфиденциальности.

Киберпреступники всегда выбирают легкий способ заработать большие деньги.

Последствия одной успешной кибератаки имеют далеко идущие последствия, включая финансовые потери, кражу интеллектуальной собственности и потерю доверия потребителей.

МАТРИЦА ЗАМЕДЛЕНИЙ

Матрица путаницы - это механизм определения точности модели бинарной классификации. Правая диагональ в матрице указывает на неверный прогноз, тогда как левая диагональ указывает на правильный прогноз.

Матрицы путаницы полезны, поскольку они дают прямое сравнение таких значений, как истинно положительные, ложноположительные, истинно отрицательные и ложноотрицательные.

Теперь, каковы эти значения, такие как True Positives, False Positives, True Negatives и False Negatives?

Истинные положительные результаты (TP): правильное значение, предсказанное моделью машинного обучения, было на самом деле правильным.

True Negatives (FN): правильное значение, предсказанное моделью машинного обучения, на самом деле было неверным предсказанием.

Ложные срабатывания (FP): неправильные значения, предсказанные моделью машинного обучения, на самом деле были правильными — ошибка типа 1.

False Negatives (FN): неправильное значение, предсказанное моделью машинного обучения, на самом деле было неверным — ошибка типа 2.

Из всех этих значений FP считается самым опасным, потому что согласно IDS (системе обнаружения вторжений) все положительно, но на самом деле оно ложно.

КИБЕРНАЯ БЕЗОПАСНОСТЬ: ЛОЖНЫЕ ПОЛОЖЕНИЯ

Ложные срабатывания – это ошибочно помеченные предупреждения системы безопасности, указывающие на наличие угрозы, хотя на самом деле ее нет. Эти ложные/не вредоносные оповещения увеличивают шум для уже перегруженных команд безопасности и могут включать программные ошибки, плохо написанное программное обеспечение или нераспознанный сетевой трафик.

По умолчанию большинство групп безопасности игнорируют ложные срабатывания. К сожалению, эта практика игнорирования предупреждений безопасности — какими бы тривиальными они ни казались — может вызвать усталость от предупреждений и привести к тому, что наша команда пропустит фактические важные предупреждения, связанные с реальными/злонамеренными киберугрозами (как в случае с утечкой данных Target). .

Эти ложные срабатывания составляют примерно 40 % предупреждений, которые команды кибербезопасности получают ежедневно, и в крупных организациях могут быть чрезмерными и огромной тратой времени.

Чтобы понять это более ясно, давайте подумаем о гипотетической проблеме классификации.

Допустим, мы хотим предсказать, сколько людей заразится заразным вирусом за раз до того, как у них проявятся симптомы, и изолировать их от здорового населения. Два значения для нашей целевой переменной будут: больной и не больной.

Теперь вы, должно быть, задаетесь вопросом — зачем нам нужна матрица путаницы, когда у нас есть наш всепогодный друг — Точность? Что ж, посмотрим, где точность дрогнет.

Наш набор данных является примером несбалансированного набора данных. Имеется 947 точек данных для отрицательного класса и 3 точки данных для положительного класса. Вот как мы будем рассчитывать точность:

Давайте посмотрим, как работает наша модель.

Итоговые значения результатов:

TP = 30, TN = 930, FP = 30, FN = 10

Итак, точность для нашей модели получается:

Точность = 30+930/(30+30+10+930)=0,96

96%! Неплохо!

Но это дает неверное представление о результате. Подумай об этом.

Наша модель говорит: «Я могу предсказать больных людей в 96% случаев». Однако делается наоборот. Он предсказывает людей, которые не заболеют с точностью 96%, в то время как больные распространяют вирус!

Считаете ли вы, что это правильный показатель для нашей модели, учитывая серьезность проблемы? Разве мы не должны измерять, сколько положительных случаев мы можем правильно предсказать, чтобы остановить распространение заразного вируса? Или, может быть, из правильно предсказанных случаев, сколько положительных случаев для проверки надежности нашей модели?

Здесь мы сталкиваемся с двойной концепцией точности и отзыва.

ТОЧНОСТЬ:

Точность говорит нам, сколько из правильно предсказанных случаев на самом деле оказались положительными.

НАПОМНИТЬ:

Припоминание говорит нам, сколько реальных положительных случаев мы смогли правильно предсказать с помощью нашей модели.

ДОСТАТОЧНО ЛИ МАШИННОГО ОБУЧЕНИЯ, ЧТОБЫ ОСТАНОВИТЬ КИБЕРПРЕСТУПНОСТЬ?

Машинное обучение действительно хорошо справляется с некоторыми вещами, например, быстро сканирует большие объемы данных и анализирует их с помощью статистики. Системы кибербезопасности генерируют огромное количество данных, поэтому неудивительно, что эта технология является таким полезным инструментом.

«У нас появляется все больше и больше доступных данных, и эти данные, как правило, рассказывают историю», — говорит Built In Раффаэль Марти, главный специалист по исследованиям и разведке в компании Forcepoint, занимающейся кибербезопасностью. «Если вы понимаете, как анализировать данные, вы сможете выявить отклонения от нормы».

И эти отклонения иногда обнаруживают угрозы. Благодаря этой важной функции использование машинного обучения растет во многих секторах. Он используется для задач, требующих распознавания изображений и речи.

МАШИННОЕ ОБУЧЕНИЕ В КИБЕРБЕЗОПАСНОСТИ

Машинное обучение стало жизненно важной технологией кибербезопасности. Машинное обучение превентивно устраняет киберугрозы и укрепляет инфраструктуру безопасности за счет обнаружения закономерностей, картирования киберпреступлений в режиме реального времени и тщательного тестирования на проникновение.

ССЫЛКИ

https://builtin.com/artificial-intelligence/machine-learning-cybersecurity

https://www.analyticsvidhya.com/blog/2020/04/confusion-matrix-machine-learning/