ВВЕДЕНИЕ
Распознавание рукописного текста — это проблема, которая восходит к первым автоматическим машинам, которым нужно было распознавать отдельные символы в рукописных документах. Классификация рукописного текста или чисел важна для многих реальных сценариев. Например, почтовая служба может сканировать почтовые индексы на конвертах, чтобы автоматизировать группировку конвертов, которые должны быть отправлены в одно и то же место. В этой статье рассказывается о распознавании рукописных цифр (от 0 до 9) с использованием известного набора данных digits из Scikit-Learn.
Scikit-Learn – это библиотека для Python, содержащая множество полезных алгоритмов, которые можно легко реализовать и изменить для целей классификации и других задач машинного обучения.
ПРЕДПОСЫЛКИ
Если у вас уже есть Jupyter Notebook и установлены все необходимые библиотеки и пакеты Python, вы готовы приступить к работе.
ШАГ 1. ИМПОРТ БИБЛИОТЕК
ШАГ 2: ИМПОРТ НАБОРА ДАННЫХ
ШАГ 3: ОБУЧЕНИЕ, ПРОВЕРКА И ПРОГНОЗИРОВАНИЕ НАБОРА ДАННЫХ
ШАГ 4: ЗАГРУЗКА НАБОРА ДАННЫХ DIGITS И ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ
ШАГ 5: ПРОГНОЗ ЦИФР
ЗАКЛЮЧЕНИЕ
Здесь мы узнаем, как импортировать набор данных из sklearn, как строить модель и делать прогнозы с помощью функций fit() и прогнозирования(). Мы также вычисляем точность с помощью библиотеки Sklearn, и она получается 100,0.