Живи так, как будто ты умрешь завтра. Учитесь, как будто вы должны жить вечно

Махатма Ганди

Обучение – это непрерывный процесс жизни. В тот день, когда мы перестанем учиться чему-то новому, это будет конец жизни.

Недавно я прошел строгий процесс обучения, которым я хотел бы поделиться. Надеюсь, это мотивирует вас, ребята, стремиться узнать больше и быть открытыми для новых идей, знаний и т. д. Я подающий надежды вограммер, *смеется*, (так меня назовет мой друг). Это его сленг для леди, которая кодирует.

Недавно я поставил перед собой задачу изучить область компьютерных наук под названием МАШИННОЕ ОБУЧЕНИЕ. Машинное обучение — это тип искусственного интеллекта (ИИ), который позволяет компьютерам учиться без явного программирования.

В начале этого года я столкнулся с дилеммой выбора темы исследования для получения степени магистра. Во время исследования я решил выбрать область исследования, в которой мой интерес подогревается. Это было решено, чтобы держать меня в движении, потому что я знал, что будет много проблем. Я был новичком в концепции машинного обучения, никогда не изучал его. Темой моего исследования был анализ настроений в твитах. Анализ настроений включает в себя классификацию полярности (положительной, нейтральной или отрицательной) данного текста (в данном случае твитов). Я решил использовать методы машинного обучения, чтобы проанализировать настроение твитов. Все эти решения были оооооооооооооооооооооооооооооо из-бы не из церковного ума, мне пришлось копать глубоко в исследованиях, читая множество журналов, учебников и консультируясь со специалистами в этой области.

Теперь, тема исследования и концепции были получены. Следующим этапом было определение инструмента, который будет использоваться. До этого года я не программировал. Основываясь на моих выводах, языки программирования, в основном используемые для анализа: Р и Питон. Я выбрал Python, потому что он поддерживает множество встроенных библиотек для обработки естественного языка. Вау! Совершенно новый мир для меня. У меня была возможность использовать WEKA, набор программного обеспечения для машинного обучения, написанного на Java (почти все использовали его в моем отделе), но НЕТ, это было бы слишком просто для меня. Все, что мне нужно было сделать с WEKA, это ввести набор данных (твиты), нажать на несколько кнопок, и мой анализ был завершен. У меня также была возможность отдать проект кому-то, кто сделал бы это за меня, но я ничему не научусь, делая это.

Вместо этого я хотел бы гордиться собой как исследователем (смеется, я очень скромный ооо). Путешествие началось с изучения Python. Теперь, что касается получения набора данных, я был совершенно новичком в парсинге веб-страниц, и все благодаря Google. Я узнал, как извлекать твиты, зарегистрировавшись в Twitter, чтобы получить лицензию. Как только это было сделано, я мог двигаться дальше, потому что набор данных (твиты) очень важен в майнинге. Затем на этап предварительной обработки, фильтрации и обучения.

Для меня это было непросто, но с помощью коллег с опытом программирования мне стало легче. «Ни один человек не является островом». Чтобы учиться, я выработал отношение к поиску помощи у кого угодно, ну, не просто у кого-нибудь, а у людей, которые могли бы оказать положительное влияние.

Я помню, как мой руководитель сказал мне добавить кластеризацию к моим целям. На самом деле я намеревался работать только над классификацией (кластеризация и классификация — это методы машинного обучения). Сначала эта идея не приветствовалась, потому что я видел в ней дополнительную работу для себя. Я принял вызов (я люблю вызовы), хорошо изучил его и позже узнал; на самом деле это было лучшее, что можно было сделать. Я работал с необработанным набором данных, и для любого процесса классификации требуется помеченный набор данных. Итак, кластеризация использовалась для группировки набора данных в кластеры на основе некоторой функции сходства.

Это был действительно сложный опыт для меня, но я многому научился, и это было весело! Ближе к концу моей исследовательской работы мой руководитель похвалил меня за усердие в работе. Я помню, как я был взволнован, и я сейчас. Эта поговорка, которую я увидел на картинке друга, поддерживает меня: «Ничего хорошего в жизни не бывает легко».

Обучение дает творчество, творчество ведет к мышлению, мышление дает знание, знание делает вас великим

APJ Абдул Калам