Примечание. Литература по «составным наименованиям» огромна, и вы обнаружите, что то же самое явление (которое мы вскоре опишем) обсуждается под названием «составные наименования» или «составные наименования». Чтобы решить, какой из них использовать здесь, я проконсультировался с Google. Фраза «номинальные соединения» привела к21 900 000 результатов, в то время как фраза «составные номиналы» дала44 200 000 результатов (почти в два раза больше) — так что я буду придерживаться «номинальных соединений». '.

Что такое номинальные соединения и почему они имеют значение?

Простыми словами, именная составная часть (далее НК) — это 0 или более прилагательных, за которыми следует 1 или более существительных. Вы можете думать об этом как о каком-то предмете или теме обсуждения (семантически сущности), которая может заполнить некоторый «слот» в более широком дискурсе (предмет, агент, место, тема и т. д.). Поэтому, хотя я могу обсуждать определенную «систему Я также могу обсуждать «компьютерную систему» ​​и далее обсуждать «распределенную компьютерную систему» ​​и даже «продвинутую распределенную компьютерную систему» ​​и т. д. Таким образом, я всегда могу уточнить главное существительное, используя другие существительные и прилагательные. (Я не уверен, есть ли какие-либо психолингвистические исследования, в которых проводились какие-то эксперименты с нашей толерантностью в отношении длины именного составного слова; лично мой предел — 4, так что что-то вроде «магазин антикварной домашней мебели» — это почти все, на что я способен. терпеть. Это управляемо: мы говорим о магазине, а точнее о магазине мебели, а еще точнее о магазине мебели для дома. , и, наконец, о магазине антикварной мебели для дома. Это я могу сделать. Но дальше этого я начинаю мечтать о чем-то вроде семантического калькулятора.

Теперь, почему именные составные части важны, и уделялось ли им столько внимания в компьютерной лингвистике (классической, старой школы)? Ну, в основном потому, что они отражают тесную связь обычного разговорного языка с человеческими знаниями и нашими когнитивными способностями. В частности, когда мы используем именные составные части, мы все предполагаем, что слушатель/читатель может «обнаружить» скрытую связь между всеми прилагательными и существительными в последовательности. Итак, когда я говорю об инженере-ядерщике, вы все будете знать, что я имею в виду инженера, специализирующегося наядерной энергетике, и когда я говорю о ядерном плане, вы все будете знать, что я имею в виду завод, который производитядерную энергию. Таким образом, «производит» и «специализируется на» — это скрытые отношения. Так же,

Представляете комбинации? И это только с использованием 2 компонентов последовательности. Помимо обнаруженияотсутствующей (скрытой) связи в трех или более именных сложных словах, существует еще одна трудность: какие модификации к каким относятся? Учти это:

Всем известно, что «профессор восточной философии» относится не к профессору философии, который является восточным, а к профессору, который преподает восточную философию, поэтому «восточный» модифицирует «философию», а «удивительная философия». «профессор», мы говорим не о профессоре, преподающем «потрясающую философию», а об удивительном профессоре, преподающем философию. Все становится еще интереснее (хорошо, так что забудьте о том, что GPT-3 знает язык, просто читая символы, по крайней мере, еще на несколько минут. Вы можете вернуться к этой научной фантастике позже!).

Все может стать еще интереснее, если добавить к картинке прилагательные. Учти это:

Таким образом, «дорогое ружье» — это дорогое ружье (а «большое ружье» — это большое ружье и так далее). Простой. Но что такое «фальшивое ружье» — ружье, которое не ружье, — наши компьютеры закоротят! Лейтенант Дейта из StarTrek Enterprise этого не «поймет». (также «игрушечное пианино» — это «пианино, которое не совсем пианино»)

Хотите, чтобы все было еще интереснее? Ну вот еще:

Таким образом, «старый танцор» относится к «старому танцору», а «красивый танцор» может относиться к «красивому танцору» или к «танцору, который красиво танцует».

Так что насчет феномена пропавшего текста?

Все вышеприведенное обсуждение именных составных частей было направлено на то, чтобы подчеркнуть основную причину сложности понимания естественного языка (для машин). А именно, проблемы связаны с тем, что почти все наше языковое общение сжато — мы упускаем слишком много деталей, которые, как мы можем с уверенностью предположить, знает слушатель/читатель в силу нашего общего знание мира здравого смысла. И эти общиезнания не так велики, как вы думаете. Доказательство: поговорите с любым 4-летним ребенком, у которого нет предметной области, технических или физических знаний о мире.

Почти все наше лингвистическое общение исключается, и для эффективного общения то, что, по нашему мнению, не должно (и не нужно) отправляться в наших сообщениях. Но мы опускаем (поскольку мы хотим, чтобы сообщение было расшифровано правильно) только ту информацию, которую мы можем с уверенностью предположить, доступную для слушателя/читателя. Этот «феномен отсутствующего текста» (MTP) проявляется во многих сложных проблемах понимания языка. Здесь я подробно описал это явление, как оно проявляется в том, что мы называем составными именами (или составными именами, если вы не доверяете Google!)

___
ОНТОЛОГИК — Медиум