Статьи по теме training-data

Публикации по теме 'training-data'

🧑🏽‍🤝‍🧑🏻 Наблюдение за проблемами маркировки: как сотрудничать и отслеживать активность аннотаций

Мы рады объявить о новом инструменте для совместной работы и отслеживания - Проблемы с маркировкой. Каждой команде аннотаций необходимо организовать свою работу, но никто не хочет прекращать работу, чтобы отслеживать работу. Supervisely Issues позволяет держать работу огромного коллектива этикетировщиков в одном месте. Что такое контролируемые проблемы? Маркировка данных - это масштабное сотрудничество: менеджеры, эксперты в предметной области, специалисты по данным, внутренние..

Соображения по поводу создания и покупки программного обеспечения для обучающих данных

Эксперты в предметной области Аннотации - это очень человеческое занятие. Это высокотехнологичная и часто используемая система, в которой аннотаторы могут проводить в системе много часов в день. Это означает, что система должна работать на уровне, скажем, текстового процессора. Пора торговать Даже если составить бюджет команды и поддержки, потребуются годы, чтобы построить эффективную, протестированную и масштабируемую систему. Как и в случае с программной инженерией, создание..

Как загрузить изображения и ограничивающие рамки из FathomNet с помощью Python

FathomNet предоставляет fathomnet-py , API на стороне клиента Python, чтобы помочь ученым, исследователям и разработчикам взаимодействовать с данными FathomNet. В этой статье мы рассмотрим код, демонстрирующий типичный вариант использования: загрузка изображений и ограничивающих рамок . Настраивать Если вы хотите продолжить, вам сначала нужно установить fathomnet пакет Python через pip . Вам понадобится Python ≥3.6. pip install fathomnet Полная документация проекта..

Улучшение решений наблюдения Земли в сельском хозяйстве с помощью машинного обучения

Автор: Хамед Алемохаммад , главный специалист по данным, Radiant Earth Foundation Машинное обучение (ML) и наблюдение Земли (EO) - взаимодополняющие технологии. В то время как EO помогает нам понять естественные и антропогенные изменения на Земле, ML дает нам возможность анализировать огромные объемы изображений и строить новые модели для данных EO, что было бы очень сложно, если не невозможно, с использованием традиционных физических моделей несколько коротких лет назад. Обещания..

Что такое аннотация данных и в чем ее ключевое преимущество в 2021 году?

Как взять под контроль правильный цикл маркировки данных? Аннотации данных и размер рынка Техника аннотации данных используется, чтобы сделать объекты узнаваемыми и понятными для моделей машинного обучения. Это имеет решающее значение для развития отраслей машинного обучения (ML), таких как распознавание лиц, автономное вождение, воздушные дроны, робототехника и многие другие ИИ и приложения. Согласно отчету Research And Markets, мировой рынок аннотаций данных оценивался в 695,5..

Вопросы по теме 'training-data'

построение положительных выборок для повернутых изображений для каскадного обучения в OpenCV

Мне нужно обучить каскадный классификатор для обнаружения транспортных средств и различных углов обзора. Я использую OpenCV. Некоторые углы, которые мне нужно запечатлеть, приводят к тому, что транспортное средство на изображении размещается по...

1705 просмотров

01.11.2021

Тренировочный набор для распознавания лиц

Может кто-нибудь объяснить мне, что означает обучающий набор в контексте распознавания лиц ? Я читал журналы и часто вижу такие страницы, как В экспериментах пять выборок каждого человека, выбранного случайным образом, используются для...

1640 просмотров

face-recognition java training-data image-recognition

14.11.2021

R: Как разделить фрейм данных на наборы для обучения, проверки и тестирования?

Я использую R для машинного обучения. Следуя стандартной методологии машинного обучения, я хотел бы случайным образом разделить свои данные на наборы данных для обучения, проверки и тестирования. Как мне это сделать в R? Я знаю, что есть...

57530 просмотров

r machine-learning training-data

28.11.2021

Почему бы не оптимизировать гиперпараметры в наборе данных поезда?

При разработке нейронной сети обучающие данные обычно разделяются на наборы данных Train, Test и Holdout (многие называют их Train, Validation и Test соответственно. То же самое, но разные имена) . Многие советуют выбирать гиперпараметры на основе...

4695 просмотров

machine-learning training-data neural-network

15.10.2021

Невозможно обучить SVM pySpark, проблема с меткой точки

523 просмотров

python machine-learning pyspark training-data apache-spark-mllib

03.11.2021

Следует ли при обучении нейронной сети передавать в сеть все данные обучения за один раз?

Я чувствую, что это что-то, что описано в NN 101, но я не могу вспомнить ответ (если он есть) и не могу найти ответ в Интернете. Скажем, у меня есть обучающий набор из 80 предметов и тестовый набор из 20 предметов. Я инициализировал веса и...

105 просмотров

machine-learning training-data neural-network

18.10.2021

Разделение тренировочного и тестового наборов

Я пытаюсь реализовать разделение набора данных на наборы для обучения и тестирования, но в функции, начиная со строки 45, я столкнулся с проблемой. После запуска программа возвращается с ошибкой KeyError: 667952 (номер ошибки меняется каждый раз,...

121 просмотров

python-3.x training-data naivebayes

24.09.2021

Точность обучения резко возрастает, точность теста стабилизируется

При обучении сверточной нейронной сети, следуя этой статье, точность обучающего набора возрастает слишком сильно, в то время как точность на испытательном наборе стабилизируется. Ниже приведен пример с 6400 обучающими примерами, выбранными...

1478 просмотров

machine-learning tensorflow training-data conv-neural-network

05.12.2021

Для чего используются данные проверки в последовательной модели Keras?

У меня простой вопрос: какие данные проверки передаются в model.fit в последовательной модели, для которой используется? И влияет ли это на то, как обучается модель (обычно используется набор проверки, например, для выбора гиперпараметров в...

67334 просмотров

python validation keras training-data keras-2

07.10.2021

Самоорганизующаяся карта для разделения наборов данных

Я пытаюсь использовать самоорганизующуюся карту для разделения наборов данных на наборы для обучения, проверки и тестирования. Я создал модель SOM, dimension1 = 10; dimension2 = 10; net = selforgmap([dimension1...

223 просмотров

validation matlab training-data som test-data

17.09.2021

Обработка несбалансированных данных в GradientBoostingClassifier с использованием взвешенного класса?

У меня очень несбалансированный набор данных, и мне нужно построить модель поверх него для задачи классификации. В наборе данных около 30000 образцов, из которых около 1000 образцов помечены как —1—, а остальные - 0. Я строю модель с помощью...

1730 просмотров

python machine-learning training-data scikit-learn boosting

08.09.2021

Как обучить модель в nodejs (tensorflow.js)?

Я хочу создать классификатор изображений, но не знаю питона. Tensorflow.js работает с javascript, с которым я знаком. Можно ли с ним обучать модели и что для этого нужно сделать? Честно говоря, я понятия не имею, с чего начать. Единственное, что...

4729 просмотров

node.js javascript tensorflow tensorflow.js training-data

22.09.2021

Подгонка обучающих этикеток к 2D-списку в Scikit-learn

Я пытаюсь сопоставить строки в 2d, чтобы перечислить элементы в списке меток с помощью Scikit-learn. Например: from sklearn import tree clf = DecisionTreeClassifier() #2D list of training data: training_data = [[1, 2, 3], [1, 2, 4,...

65 просмотров

python training-data classification scikit-learn

02.12.2021

Как обучить луи, которые имеют очень тесно связанные высказывания, которые следует тренировать в двух разных целях

У меня очень большие данные, которые я обучил в LUIS. Большинство намерений имеют высказывания, которые очень и очень тесно связаны друг с другом, и, следовательно, LUIS не может указать на исправление намерения после обучения. Например, возьмем...

99 просмотров

training-data azure-language-understanding

03.12.2021

модуль 'tensorflow' не имеет атрибута 'set_random_seed' для обучающего конвейера RASA NLU контролируемых встраиваний

Поэтому я пытаюсь обучить свои данные с помощью конвейера контролируемых встраиваний . Версия Rasa: 1.10.12 Версия Tensorflow: 2.1.1 Раса НЛУ: 0,15.1 config.yml содержит следующее: язык: «en» конвейер:...

1856 просмотров

python tensorflow training-data rasa-nlu rasa

27.09.2021

Блокнот tqdm - 2 внутренних планки

Я пытаюсь распечатать индикатор выполнения обучения с помощью tqdm. Я хотел бы отслеживать прогресс эпох, и для каждой эпохи у меня есть 2 индикатора выполнения: мини-батчи train_loader и мини-батчи validation_loader. Код выглядит примерно так:...

18 просмотров

python pytorch training-data tqdm

26.11.2021

GridSearchCV - какие данные следует использовать?

В настоящее время я работаю над проблемой бинарной классификации с примерно 2000 точками данных в обучающем наборе, и мне интересно, следует ли мне использовать весь обучающий набор для gridsearch или я должен сначала сделать разделение для генерации...

44 просмотров

python training-data train-test-split grid-search gridsearchcv

03.03.2022

Как сгенерировать файл tiff / box из изображения для обучения Tesseract в Windows

Я пытаюсь обучить Tesseract в Windows, и для этого мне нужен файл пары tiff / box, и я пытаюсь создать его с помощью jTessBoxEditor, но он не принимает изображения в качестве входных данных. Я также пробовал boxFactory, но он не работает должным...

9743 просмотров

windows machine-learning training-data ocr tesseract

27.03.2022

Обучение модели классификатора Opennlp

Я пытаюсь обучить модель с помощью приведенного ниже кода, но я продолжаю получать сообщение об ошибке в методе DocumentCategorizerME.train() , который говорит мне изменить factory на doccatfactory . Зачем? public void trainModel() {...

161 просмотров

java training-data opennlp

04.04.2022

Матрица обучения для SVM в OpenCv

Мои функции представляют собой нормализованные значения RGB, то есть они содержат значения в диапазоне от 0 до 0,1. Я объявил обучающую матрицу CV_64FC1. Он содержит 1000 строк и 60 столбцов, но с десятичными значениями, такими как 0,3333 или 0,2789....

60 просмотров

training-data svm

12.04.2022