Сделал мини-проект, который подпадает под проект обработки изображений и следует модели CNN для классификации изображений.

Предыстория проекта: -

Использованы два набора данных:
1. Стандартный набор данных MNIST 0–9 от LeCun et al.
2. Набор данных Kaggle AZ от Сачина Пателя на основе специальной базы данных NIST 19.

Обучение модели OCR с использованием Keras, TensorFlow и архитектуры глубокого обучения ResNet.

О различных используемых библиотеках и платформах: -

Используется OpenCV для предварительной обработки изображения (улучшение качества изображения за счет удаления шума и усиления контраста между рукописным текстом и фоном).

Keras – это высокоуровневый API нейронных сетей, созданный на основе TensorFlow. Keras используется для предоставления ряда готовых слоев, которые можно легко комбинировать. Он написан на Python и используется для создания внедрение нейронных сетей легко

TensorFlow может обрабатывать большие наборы данных и используется для масштабирования моделей на нескольких устройствах, что упрощает обучение больших моделей.
Платформа TensorFlow помогает внедрять передовые методы автоматизации данных, отслеживания моделей и повышения производительности. мониторинг и переобучение моделей.

ResNet использует особый блок, называемый остаточным блоком, который позволяет модели изучать функции из изображений, что позволяет создавать гораздо более глубокие сети, не сталкиваясь с проблемами исчезающих градиентов.

Для загрузки a_z_handwriting_data.csv используйте ссылку:-
https://www.kaggle.com/datasets/sachinpatel21/az-handwriting-alphabets-in-csv-format и вставьте файл csv в корневой каталог.

Установка и выполнение: -

Ссылка на проект: -



Папкаimages содержит изображения, используемые для целей тестирования.

Файлtrain_ocr_mdel.py предварительно обрабатывает комбинированное изображение, полученное из обоих наборов данных. Более того, он создает соответствующую модель с использованием архитектуры ResNet и сохраняет модель в виде файла handwriting.model.

Thetest_handwriting.py читает входное изображение и файл модели, переданные в аргументах, и предсказывает результат.

ИСПОЛЬЗОВАНИЕ :-

python test_handwriting.py --model handwriting.model --image images/hello_world.png