Этот пост будет частью серии, в которой будет документировано мое путешествие по машинному обучению и процесс, когда я приступаю к созданию инструмента Glyph Detector.

Небольшая предыстория.

Я профессионал в области информационных технологий и кибербезопасности, и лучше всего я учусь, создавая вещи. Я родом из Судана, отсюда и моя связь с Нубией. Много лет назад, когда я открыл для себя язык программирования Python, мой друг и коллега в то время решил заняться проектом. Этот проект заключался в том, чтобы оцифровать нубийский словарь. Нам потребовалось много месяцев, и мы МНОГОЕ узнали, и мы сделали это, и по состоянию на два года назад (из этого поста) исходный код доступен на GitHub для всех.

Этот проект привлек к нам внимание Dr. Vincent Gervin Oei, много лет изучающий, собирающий и документирующий нубийский язык. Мы имели удовольствие работать с ним, делая все, что в наших силах, со знаниями, которые у нас были на тот момент. У меня была возможность познакомиться со многими другими замечательными людьми, которые делают действительно потрясающую работу. Например, создание нубийского шрифта для установки на компьютеры, чтобы вы могли печатать на нубийском диалекте. Выполнение переводов документов с нубийских диалектов на английский язык. Не буду врать, я немного завидовал и в то же время вдохновлялся, я хотел найти способ использовать технологии, чтобы помочь.

Одна из вещей, которые поразили меня, исходила от Dr. Канал Винсента на Youtube, у него есть эти видео, где вы видите, как он просматривает изображения разбитых каменных табличек или старых бумаг, как он вручную читает и извлекает читаемые нубийские глифы, а затем переводит их. Это увлекательно, и тогда это поразило меня. Как я могу помочь.

Идея.

Увидев, как доктор Винсент просматривает эти изображения, я подумал: «А что, если бы существовал инструмент, который мог бы сделать изображение, распознать текст (глиф) и распечатать читаемый текст на экране или в текстовом файле». Это очень помогло бы ускорить его процесс! В то время я все еще находился на начальном этапе изучения Python, я только что закончил нубийский словарь и понятия не имел, с чего начать. Через некоторое время я услышал о распознавании символов объектов (OCR), но в основном это лучше всего работало с печатным текстом, поэтому я отложил эту идею на второй план.

Забегая вперед, я начал посещать занятия по машинному обучению, потому что эта тема мне очень интересна, но один проект особенно привлек мое внимание. Проект MNIST по распознаванию рукописного ввода. Суть в том, что вы используете набор данных, предоставленный MNIST, в котором есть изображения рукописных цифр, и цель состоит в том, чтобы создать модель машинного обучения, которая сможет распознавать рукописный номер на изображении. Это самый близкий проект, насколько я могу представить, к тому, что я хочу сделать с нубийскими глифами.

План.

Я планирую успешно завершить проект MNIST, чтобы понять, как (и какими способами) решается эта проблема. Я также взгляну на необработанный набор данных, чтобы получить представление о том, как выглядит этот тип набора данных, я даже наткнулся на Набор данных MNIST в виде файла CSV, поэтому мне было бы любопытно посмотреть, как он создается как хорошо.

Я не думаю, что существует набор данных на нубийском языке, а это значит, что мне придется создать его с нуля. Не волнуйтесь, я буду сопровождать вас в этом путешествии через этот блог и серию постов.

В заключение.

Я очень рад начать это путешествие по машинному обучению, и я надеюсь, что к его концу у меня будет работающая модель детектора глифов, которая может быть полезна для усилий по сохранению нубийского языка, и что мы все узнаем что-то интересное. вещи вместе.

Спасибо за прочтение.
Давайте напишем что-нибудь классное.
Эш, The Machine Learning.

Поддержите проект.
Купи мне кофе | Стань моим спонсором GitHub | Стать Патреоном