Публикации по теме 'data-mining'


Защита систем глубокого обучения от враждебных атак
Каждый день нейронные сети интегрируются в широкий спектр высокоэффективных систем, от беспилотных автомобилей до биомедицинского скрининга . и диагностика . В связи с этим возникает чрезвычайно важный вопрос: насколько защищены эти системы от атак ? К сожалению, ответ заключается в том, что они весьма уязвимы. Исследователи из Технологического института Джорджии и Intel недавно продемонстрировали , как злоумышленники могут обмануть системы компьютерного зрения (например,..

Построение прогностической модели хронических заболеваний сердца с использованием логистической регрессии
«Некоторые вещи настолько неожиданны, что никто не готов к ним. « — Лео Ростен в Рим не сгорел за один день По данным Всемирной организации здравоохранения, сердечно-сосудистые заболевания (ССЗ) являются основной причиной смерти во всем мире, унося примерно 17,9 миллиона жизней ежегодно. ССЗ представляют собой группу заболеваний сердца и сосудов и включают ишемическую болезнь сердца, цереброваскулярные заболевания, ревматические заболевания сердца и другие состояния. Более четырех..

Прогноз выживания Титаника
Когда он был впервые спущен на воду в 1912 году, британский пароход был самым большим кораблем в мире. Невероятный 882 фута в длину и 175 футов в высоту, Титаник был провозглашен самым дорогим, самым роскошным кораблем, когда-либо построенным. Говорили, что он «непотопляемый». 10 апреля 1912 года «Титаник» отплыл в Нью-Йорк. Через четыре дня после отплытия случилось великое бедствие: «Титаник» затонул на дне северной части Атлантического океана. Спустя 109 лет до сих пор остаются..

Недообучение X Переоснащение
Недообучение и переоснащение — две распространенные проблемы, возникающие в машинном обучении. Недостаточная подгонка происходит, когда модель не может уловить основную тенденцию в данных, а переобучение происходит, когда модель слишком сложна и фиксирует случайный шум в данных. В этой статье мы рассмотрим причины недообучения и переобучения, как их идентифицировать и как их предотвратить. Основной причиной недообучения является модель, которая слишком проста для отражения сложности..

Как использовать пакет Tweepy Python
Получите все, что вам может понадобиться, из твита, используя пакет tweepy python, и отформатируйте его в фрейм данных pandas. Твиттер — это прекрасная атмосфера для изучения различных типов пользователей, отношений и информации. Это благодатная почва для многих видов исследований, включая шахты. Прошлые исследования также означают существующие наборы данных — так зачем беспокоиться о потоке данных Twitter? Ответ, конечно же, заключается в том, что не каждая обувь подходит, и..

Матрицы путаницы для оценки производительности 4-ключевого классификатора с решенной проблемой.
Матрица путаницы — это структура, используемая для оценки производительности прогностической модели на основе количества правильно и неправильно предсказанных моделью тестовых данных. Эта матрица путаницы обеспечивает легкое для понимания отображение производительности модели классификации, не только предоставляя, какие классы прогнозируются правильно и неправильно, но и тип возникающих ошибок. Матрица путаницы используется для описания прогностической модели/классификатора на наборе..

Сбор данных
Данные проникли во все элементы предприятия и общества. Теперь компании могут использовать технологии интеллектуального анализа данных и машинного обучения, чтобы улучшить все, от операций продаж до финансового анализа по инвестиционным причинам. Интеллектуальный анализ данных — это процесс анализа огромных объемов данных с целью выявления бизнес-информации, которая может помочь компаниям решать проблемы, смягчать угрозы и использовать новые возможности. Название этой дисциплины..