Публикации по теме 'training-data'


🧑🏽‍🤝‍🧑🏻 Наблюдение за проблемами маркировки: как сотрудничать и отслеживать активность аннотаций
Мы рады объявить о новом инструменте для совместной работы и отслеживания - Проблемы с маркировкой. Каждой команде аннотаций необходимо организовать свою работу, но никто не хочет прекращать работу, чтобы отслеживать работу. Supervisely Issues позволяет держать работу огромного коллектива этикетировщиков в одном месте. Что такое контролируемые проблемы? Маркировка данных - это масштабное сотрудничество: менеджеры, эксперты в предметной области, специалисты по данным, внутренние..

Соображения по поводу создания и покупки программного обеспечения для обучающих данных
Эксперты в предметной области Аннотации - это очень человеческое занятие. Это высокотехнологичная и часто используемая система, в которой аннотаторы могут проводить в системе много часов в день. Это означает, что система должна работать на уровне, скажем, текстового процессора. Пора торговать Даже если составить бюджет команды и поддержки, потребуются годы, чтобы построить эффективную, протестированную и масштабируемую систему. Как и в случае с программной инженерией, создание..

Как загрузить изображения и ограничивающие рамки из FathomNet с помощью Python
FathomNet предоставляет fathomnet-py , API на стороне клиента Python, чтобы помочь ученым, исследователям и разработчикам взаимодействовать с данными FathomNet. В этой статье мы рассмотрим код, демонстрирующий типичный вариант использования: загрузка изображений и ограничивающих рамок . Настраивать Если вы хотите продолжить, вам сначала нужно установить fathomnet пакет Python через pip . Вам понадобится Python ≥3.6. pip install fathomnet Полная документация проекта..

Улучшение решений наблюдения Земли в сельском хозяйстве с помощью машинного обучения
Автор: Хамед Алемохаммад , главный специалист по данным, Radiant Earth Foundation Машинное обучение (ML) и наблюдение Земли (EO) - взаимодополняющие технологии. В то время как EO помогает нам понять естественные и антропогенные изменения на Земле, ML дает нам возможность анализировать огромные объемы изображений и строить новые модели для данных EO, что было бы очень сложно, если не невозможно, с использованием традиционных физических моделей несколько коротких лет назад. Обещания..

Что такое аннотация данных и в чем ее ключевое преимущество в 2021 году?
Как взять под контроль правильный цикл маркировки данных? Аннотации данных и размер рынка Техника аннотации данных используется, чтобы сделать объекты узнаваемыми и понятными для моделей машинного обучения. Это имеет решающее значение для развития отраслей машинного обучения (ML), таких как распознавание лиц, автономное вождение, воздушные дроны, робототехника и многие другие ИИ и приложения. Согласно отчету Research And Markets, мировой рынок аннотаций данных оценивался в 695,5..

Вопросы по теме 'training-data'

построение положительных выборок для повернутых изображений для каскадного обучения в OpenCV
Мне нужно обучить каскадный классификатор для обнаружения транспортных средств и различных углов обзора. Я использую OpenCV. Некоторые углы, которые мне нужно запечатлеть, приводят к тому, что транспортное средство на изображении размещается по...
1705 просмотров

Тренировочный набор для распознавания лиц
Может кто-нибудь объяснить мне, что означает обучающий набор в контексте распознавания лиц ? Я читал журналы и часто вижу такие страницы, как В экспериментах пять выборок каждого человека, выбранного случайным образом, используются для...
1640 просмотров

R: Как разделить фрейм данных на наборы для обучения, проверки и тестирования?
Я использую R для машинного обучения. Следуя стандартной методологии машинного обучения, я хотел бы случайным образом разделить свои данные на наборы данных для обучения, проверки и тестирования. Как мне это сделать в R? Я знаю, что есть...
57530 просмотров
schedule 28.11.2021

Почему бы не оптимизировать гиперпараметры в наборе данных поезда?
При разработке нейронной сети обучающие данные обычно разделяются на наборы данных Train, Test и Holdout (многие называют их Train, Validation и Test соответственно. То же самое, но разные имена) . Многие советуют выбирать гиперпараметры на основе...
4695 просмотров

Невозможно обучить SVM pySpark, проблема с меткой точки
Я пытаюсь превратить искру Dataframe в отмеченную точку. Dataframe называется DF и выглядит так: +-----+-----+-----+-----+-----+-----+-----+-----+-----+------+-----+ |step1|step2|step3|step4|step5|step6|step7|step8|step9|step10|class|...
523 просмотров

Следует ли при обучении нейронной сети передавать в сеть все данные обучения за один раз?
Я чувствую, что это что-то, что описано в NN 101, но я не могу вспомнить ответ (если он есть) и не могу найти ответ в Интернете. Скажем, у меня есть обучающий набор из 80 предметов и тестовый набор из 20 предметов. Я инициализировал веса и...
105 просмотров

Разделение тренировочного и тестового наборов
Я пытаюсь реализовать разделение набора данных на наборы для обучения и тестирования, но в функции, начиная со строки 45, я столкнулся с проблемой. После запуска программа возвращается с ошибкой KeyError: 667952 (номер ошибки меняется каждый раз,...
121 просмотров
schedule 24.09.2021

Точность обучения резко возрастает, точность теста стабилизируется
При обучении сверточной нейронной сети, следуя этой статье, точность обучающего набора возрастает слишком сильно, в то время как точность на испытательном наборе стабилизируется. Ниже приведен пример с 6400 обучающими примерами, выбранными...
1478 просмотров

Для чего используются данные проверки в последовательной модели Keras?
У меня простой вопрос: какие данные проверки передаются в model.fit в последовательной модели, для которой используется? И влияет ли это на то, как обучается модель (обычно используется набор проверки, например, для выбора гиперпараметров в...
67334 просмотров

Самоорганизующаяся карта для разделения наборов данных
Я пытаюсь использовать самоорганизующуюся карту для разделения наборов данных на наборы для обучения, проверки и тестирования. Я создал модель SOM, dimension1 = 10; dimension2 = 10; net = selforgmap([dimension1...
223 просмотров

Обработка несбалансированных данных в GradientBoostingClassifier с использованием взвешенного класса?
У меня очень несбалансированный набор данных, и мне нужно построить модель поверх него для задачи классификации. В наборе данных около 30000 образцов, из которых около 1000 образцов помечены как —1—, а остальные - 0. Я строю модель с помощью...
1730 просмотров

Как обучить модель в nodejs (tensorflow.js)?
Я хочу создать классификатор изображений, но не знаю питона. Tensorflow.js работает с javascript, с которым я знаком. Можно ли с ним обучать модели и что для этого нужно сделать? Честно говоря, я понятия не имею, с чего начать. Единственное, что...
4729 просмотров

Подгонка обучающих этикеток к 2D-списку в Scikit-learn
Я пытаюсь сопоставить строки в 2d, чтобы перечислить элементы в списке меток с помощью Scikit-learn. Например: from sklearn import tree clf = DecisionTreeClassifier() #2D list of training data: training_data = [[1, 2, 3], [1, 2, 4,...
65 просмотров

Как обучить луи, которые имеют очень тесно связанные высказывания, которые следует тренировать в двух разных целях
У меня очень большие данные, которые я обучил в LUIS. Большинство намерений имеют высказывания, которые очень и очень тесно связаны друг с другом, и, следовательно, LUIS не может указать на исправление намерения после обучения. Например, возьмем...
99 просмотров

модуль 'tensorflow' не имеет атрибута 'set_random_seed' для обучающего конвейера RASA NLU контролируемых встраиваний
Поэтому я пытаюсь обучить свои данные с помощью конвейера контролируемых встраиваний . Версия Rasa: 1.10.12 Версия Tensorflow: 2.1.1 Раса НЛУ: 0,15.1 config.yml содержит следующее: язык: «en» конвейер:...
1856 просмотров

Блокнот tqdm - 2 внутренних планки
Я пытаюсь распечатать индикатор выполнения обучения с помощью tqdm. Я хотел бы отслеживать прогресс эпох, и для каждой эпохи у меня есть 2 индикатора выполнения: мини-батчи train_loader и мини-батчи validation_loader. Код выглядит примерно так:...
18 просмотров
schedule 26.11.2021

GridSearchCV - какие данные следует использовать?
В настоящее время я работаю над проблемой бинарной классификации с примерно 2000 точками данных в обучающем наборе, и мне интересно, следует ли мне использовать весь обучающий набор для gridsearch или я должен сначала сделать разделение для генерации...
44 просмотров

Как сгенерировать файл tiff / box из изображения для обучения Tesseract в Windows
Я пытаюсь обучить Tesseract в Windows, и для этого мне нужен файл пары tiff / box, и я пытаюсь создать его с помощью jTessBoxEditor, но он не принимает изображения в качестве входных данных. Я также пробовал boxFactory, но он не работает должным...
9743 просмотров

Обучение модели классификатора Opennlp
Я пытаюсь обучить модель с помощью приведенного ниже кода, но я продолжаю получать сообщение об ошибке в методе DocumentCategorizerME.train() , который говорит мне изменить factory на doccatfactory . Зачем? public void trainModel() {...
161 просмотров
schedule 04.04.2022

Матрица обучения для SVM в OpenCv
Мои функции представляют собой нормализованные значения RGB, то есть они содержат значения в диапазоне от 0 до 0,1. Я объявил обучающую матрицу CV_64FC1. Он содержит 1000 строк и 60 столбцов, но с десятичными значениями, такими как 0,3333 или 0,2789....
60 просмотров
schedule 12.04.2022