Статьи по теме data-science

Публикации по теме 'data-science'

Поведение PAC Learning, часть 8

Полупроверенное обучение PAC у толпы (arXiv) Автор: Шивэй Цзэн , Цзе Шен Аннотация: Мы изучаем проблему краудсорсингового PAC-обучения пороговых функций. Это сложная проблема, и только недавно были созданы алгоритмы, эффективные при выполнении запросов, исходя из предположения, что заметная часть рабочих процессов идеальна. В этой работе мы исследуем более сложный случай, когда большинство может вести себя враждебно, а остальные ведут себя как шум Массарта — значительное обобщение..

Серия Пророков: Учебное руководство

Вы когда-нибудь слышали о биткойнах? Вы должны знать эту криптовалюту, появившуюся в 2009 году на финансовом рынке, позволяющую одним людям зарабатывать и накапливать огромные богатства, а других вызывать отчаяние из-за своей непредсказуемой, постоянно меняющейся спекулятивной стоимости. Это, среди многих других примеров, является прекрасной иллюстрацией огромной важности спекуляций на текущем финансовом рынке и в обществе в целом. В конце концов, кто бы не хотел всегда ставить на..

Переменные и типы данных в Java

Java для науки о данных, часть 1 Java как язык часто не фигурирует в списке языков для изучения для Data Science. Часто этот спор остается за теми, кто утверждает, что R или Python — лучший язык для начала. Но поскольку наука о данных охватывает широкий спектр областей и приложений, это означает, что один язык не может всегда делать все, или некоторые языки могут быть более полезными в других областях. Таким образом, Java является одним из тех языков, которые лучше всего работают в..

Возможности постоянной памяти с семантическим ядром и векторной базой данных Qdrant

Введение В сфере искусственного интеллекта (ИИ) и обработки естественного языка (NLP) появление больших языковых моделей (LLM) произвело революцию во множестве приложений, таких как чат-боты, системы рекомендаций и платформы семантического поиска. Важнейшим аспектом этих приложений является их способность эффективно управлять и анализировать огромные объемы неструктурированных данных. В этой статье рассматривается объединение векторной базы данных Qdrant с семантическим ядром в облаке..

Глубокое обучение и классификация изображений для начинающих

Глубокое обучение — это область машинного обучения, связанная с алгоритмами, вдохновленными структурой и функциями мозга, которые называются искусственными нейронными сетями . Это важный элемент науки о данных, который включает в себя статистику и прогнозное моделирование. Это чрезвычайно полезно для специалистов по данным, которым поручено собирать, анализировать и интерпретировать большие объемы данных; глубокое обучение делает этот процесс быстрее и проще. Глубокое обучение в..

Визуализированная линейная алгебра для начала работы с машинным обучением: часть 2

Визуализированная линейная алгебра для начала работы с машинным обучением: часть 2 Освойте элементы линейной алгебры, начните с простых и наглядных объяснений основных понятий Введение В этой статье мы продолжаем работу, начатую в Визуализированная линейная алгебра для начала работы с машинным обучением: часть 1 ». Мы рассмотрим новые концепции линейной алгебры простым и интуитивно понятным способом. Эти статьи призваны познакомить вас с миром линейной алгебры и дать понять,..

Концепция машинного обучения 34: Простое объяснение логистической регрессии

Логистическая регрессия Логистическая регрессия — это популярный алгоритм классификации, используемый в машинном обучении для прогнозирования вероятности возникновения события на основе набора входных признаков. Он используется для моделирования связи между зависимой переменной (бинарной или категориальной) и одной или несколькими независимыми переменными (непрерывными или категориальными). В этом объяснении мы рассмотрим логистическую регрессию математически, включая подходы,..