Публикации по теме 'natural-language'


Резюмирующий текст Резюмирование
При обработке естественного языка есть много сложных задач. Эта запись в блоге посвящена обобщению текста, в котором кратко излагается обзорная статья по этой теме. ( ArXiv: 1707.02268 ) Авторы статьи определили задачу как Автоматическое резюмирование текста - это задача создания краткого и понятного резюме при сохранении ключевого информационного содержания и общего смысла. В основном есть два подхода к этой задаче: извлекающее обобщение : определение важных разделов текста и..

Введение в обработку естественного языка с помощью PyTorch (2/5)
Предыдущий ‹‹ Введение в обработку естественного языка с помощью PyTorch (1/5) В предыдущем разделе мы научились представлять текст числами. Здесь мы рассмотрим некоторые подходы к передаче текста переменной длины в нейронную сеть, чтобы свернуть входную последовательность в вектор фиксированной длины, который затем можно использовать в классификаторе. Для начала давайте загрузим набор данных AG_News и создадим словарь. Чтобы упростить задачу, все эти операции объединены в..

Советы по обработке естественного языка и машинному обучению
Советы по обработке естественного языка и машинному обучению среда, 2 ноября 2016 г. Кажется, все заинтригованы машинным обучением , которое в последнее время стало модным словечком. Несмотря на то, что это пугает, вы, безусловно, можете проникнуть в поле или узнать больше о другой фразе, которую мы часто слышим, об обработке естественного языка. Прочтите несколько советов и предыстории от специалиста по данным Лесли Кордеро , который преподает наш курс Наука о данных . Лесли..

Документация по дизайну Starbot №1 — MarkovEngine
Самое первое, для чего был создан Starbot, мало чем отличалось от бота для пинг-понга. Его единственная обязанность заключалась в том, чтобы обнаруживать, когда кто-то упоминает имя моего кузена в чате, и отвечать на это словом «сука». Кто-то говорил «джастин», бот отвечал «сука». Довольно отказоустойчивый алгоритм, и я считал свою работу над этой функцией выполненной. Название Starbot в то время не было чем-то особенным. Это было мое старое имя пользователя Starlight, но с bot в..

Поисковые запросы и поисковое намерение
Оценка и улучшение условий поиска начинается с анализа запросов, которые делают пользователи. Но поисковые запросы - это не то же самое, что цели поиска. Я не говорю о неоднозначных запросах, таких как java или jaguar - примерах, которые исследователи информационного поиска часто используют, чтобы проиллюстрировать, как один поисковый запрос может соответствовать нескольким поисковым запросам. Неоднозначные запросы увлекательны в теории, но на практике они, как правило, являются..

Ткань Интернета вот-вот изменится
Ткань Интернета вот-вот изменится Четвертая промышленная революция навсегда изменит саму ткань Интернета, впервые позволив каждому человеку на планете участвовать в нем. Это смелое заявление! Позволь мне объяснить….. 1. Язык — лучший уравнитель Язык является основой всех коммуникаций для человечества. Каждый мужчина, женщина и ребенок на планете владеют языковыми навыками. Они могут быть не в состоянии читать или писать или использовать компьютер, поскольку они могут..

Помимо векторов: эффективность обработки естественного языка
Студент NYU MSDS Рауль Дельгадо Санчес рассказывает о картах распространения Когда вы пишете другу и говорите: «Я тебя упаду позже», как ваш iPhone узнает, как «упасть» заменить на «звонок»? Автокоррекция обязана своим мастерством области, которая продолжает приобретать первостепенное значение среди компьютерных ученых и является особенно активной областью исследований в нашем собственном Центре науки о данных: обработка естественного языка (NLP). Вообще говоря, часть исследования НЛП..