Как StanfordNLP / CoreNLP обрабатывает неоднозначные структуры предложений?

Я использую Stanford CoreNLP для анализа своих предложений, и он работает на удивление хорошо. Но мне интересно: поскольку CoreNLP содержит вероятностный синтаксический анализатор, как программа справляется с неоднозначностями?

«Я видел девушку в очках».

(1) Если я правильно понимаю, CoreNLP печатает САМОЕ вероятно дерево. Так что нет возможности проверить, есть ли двусмысленность, не так ли? (2) Означает ли это, что CoreNLP игнорирует синтаксические двусмысленности?

stanford-nlp

Lorento Palanomi 26.07.2016 источник

Ответы (1)

arrow_upward
1
arrow_downward

Да, CoreNLP выберет одну из двух интерпретаций и вернет ее. Тем не менее, важно отметить, что «наиболее вероятное дерево» - это то, которое синтаксически наиболее вероятно (т. Е. Больше всего похоже на деревья, которые можно увидеть в обучающих данных), а не наиболее вероятно на основе какого-либо вида реальные знания. Скорее всего, фразы «Я ел торт с вишней» и «Я ел торт вилкой» будут иметь одинаковый синтаксический анализ.

Gabor Angeli 26.07.2016

Как StanfordNLP / CoreNLP обрабатывает неоднозначные структуры предложений?

Ответы (1)

Вопросы по теме