Это круче, чем я думал

«Естественный язык - это язык, который естественно развился в использовании, в отличие от искусственных языков или компьютерного кода». - Оксфордский словарь

Не задумываясь, мы в основном можем понимать друг друга на своем естественном языке. Мы ассоциируем слова. Мы понимаем, как одно и то же слово может иметь разные значения в разных контекстах. Мы выводим значения новых слов на основе того, как они используются.

Разве это не замечательно?

Должен признаться, я не знаю, как мы это делаем, но это определенно происходит в результате какого-то учебного процесса, который у нас есть. А как насчет компьютеров? Как компьютер соотносит разные слова? Я имел обыкновение немедленно убегать от своего мыслящего мозга, когда сталкивался с этой мыслью. Это действительно звучит сложно! Но с тех пор, как я начал курсы по машинному обучению и общению на естественном языке, и у меня несколько раз взорвался мозг, я решил, что должен написать это и поделиться им с такими людьми, как вы, которые, по крайней мере, заинтригованы Эта проблема.

Ранние методы

Компьютеры запрограммированы. Они должны получать точные и конкретные инструкции, чтобы действовать в соответствии с чьими-то намерениями. Первые решения заключались в том, чтобы лингвисты и компьютерщики работали рука об руку над разработкой набора правил, которые моделируют наш язык. Вы, наверное, могли представить, насколько сложным должен быть этот набор правил, чтобы работать точно. Кроме того, могут быть новые слова и слова, значения которых со временем меняются (например, слово «гей»). Из-за неточной природы естественного языка этот метод вскоре упал.

Тем не менее, совместные усилия лингвистов и компьютерных ученых принесли определенные успехи в создании диалоговых систем. Элиза была создана по образцу психотерапевтов с внутренней моделью, которая отражает утверждения и вопросы пациентов, которые им задают, что побуждает их открываться и говорить больше. Несмотря на ограниченный объем, многие из них были готовы поделиться с ним своими личными мыслями.

Другая система, Парри, которая была создана для имитации человека с параноидальной шизофренией, была признана некоторыми прошедшей тест Тьюринга! Его модель включала в себя своего рода эмоциональный фактор, который варьировался в зависимости от задаваемых ему вопросов, что, в свою очередь, влияло на его ответы.

Современные методы

Итак, как нам преодолеть ограничения, присущие ранним методам? Он включает векторы. Да, помните, чему мы научились на уроках математики и физики, но не нашли способа применить это? Звучит очень математически, но это не так. Вместо этого мы нашли способ использовать векторы для представления удивительно простых и интуитивно понятных представлений о языке, которые могут помочь нам помочь компьютерам понять значение слов (без помощи лингвистов)!

Я оставлю вам 2 основные идеи на неделю (пока у меня будет больше времени, чтобы написать часть II). Один из них может быть элегантно выражен нижеследующим отрывком.

«Рыболовная ловушка существует из-за рыбы. Как только вы поймали рыбу, можете забыть о ловушке. Ловушка для кролика существует из-за кролика. Получив кролика, вы можете забыть о ловушке. Слова существуют из-за значения. Как только вы поймете значение, вы можете забыть слова. Где мне найти человека, который забыл слова, чтобы я мог поговорить с ним? » - Чжуанцзы, китайский философ

а другой - простой вопрос.

«Как мы можем представлять слова в пространстве?»