Публикации по теме 'data-science'
Поведение PAC Learning, часть 8
Полупроверенное обучение PAC у толпы (arXiv)
Автор: Шивэй Цзэн , Цзе Шен
Аннотация: Мы изучаем проблему краудсорсингового PAC-обучения пороговых функций. Это сложная проблема, и только недавно были созданы алгоритмы, эффективные при выполнении запросов, исходя из предположения, что заметная часть рабочих процессов идеальна. В этой работе мы исследуем более сложный случай, когда большинство может вести себя враждебно, а остальные ведут себя как шум Массарта — значительное обобщение..
Серия Пророков: Учебное руководство
Вы когда-нибудь слышали о биткойнах? Вы должны знать эту криптовалюту, появившуюся в 2009 году на финансовом рынке, позволяющую одним людям зарабатывать и накапливать огромные богатства, а других вызывать отчаяние из-за своей непредсказуемой, постоянно меняющейся спекулятивной стоимости. Это, среди многих других примеров, является прекрасной иллюстрацией огромной важности спекуляций на текущем финансовом рынке и в обществе в целом. В конце концов, кто бы не хотел всегда ставить на..
Переменные и типы данных в Java
Java для науки о данных, часть 1
Java как язык часто не фигурирует в списке языков для изучения для Data Science. Часто этот спор остается за теми, кто утверждает, что R или Python — лучший язык для начала. Но поскольку наука о данных охватывает широкий спектр областей и приложений, это означает, что один язык не может всегда делать все, или некоторые языки могут быть более полезными в других областях. Таким образом, Java является одним из тех языков, которые лучше всего работают в..
Возможности постоянной памяти с семантическим ядром и векторной базой данных Qdrant
Введение
В сфере искусственного интеллекта (ИИ) и обработки естественного языка (NLP) появление больших языковых моделей (LLM) произвело революцию во множестве приложений, таких как чат-боты, системы рекомендаций и платформы семантического поиска. Важнейшим аспектом этих приложений является их способность эффективно управлять и анализировать огромные объемы неструктурированных данных. В этой статье рассматривается объединение векторной базы данных Qdrant с семантическим ядром в облаке..
Глубокое обучение и классификация изображений для начинающих
Глубокое обучение — это область машинного обучения, связанная с алгоритмами, вдохновленными структурой и функциями мозга, которые называются искусственными нейронными сетями .
Это важный элемент науки о данных, который включает в себя статистику и прогнозное моделирование. Это чрезвычайно полезно для специалистов по данным, которым поручено собирать, анализировать и интерпретировать большие объемы данных; глубокое обучение делает этот процесс быстрее и проще.
Глубокое обучение в..
Визуализированная линейная алгебра для начала работы с машинным обучением: часть 2
Визуализированная линейная алгебра для начала работы с машинным обучением: часть 2
Освойте элементы линейной алгебры, начните с простых и наглядных объяснений основных понятий
Введение
В этой статье мы продолжаем работу, начатую в Визуализированная линейная алгебра для начала работы с машинным обучением: часть 1 ». Мы рассмотрим новые концепции линейной алгебры простым и интуитивно понятным способом. Эти статьи призваны познакомить вас с миром линейной алгебры и дать понять,..
Концепция машинного обучения 34: Простое объяснение логистической регрессии
Логистическая регрессия
Логистическая регрессия — это популярный алгоритм классификации, используемый в машинном обучении для прогнозирования вероятности возникновения события на основе набора входных признаков. Он используется для моделирования связи между зависимой переменной (бинарной или категориальной) и одной или несколькими независимыми переменными (непрерывными или категориальными). В этом объяснении мы рассмотрим логистическую регрессию математически, включая подходы,..