Как StanfordNLP / CoreNLP обрабатывает неоднозначные структуры предложений?

Я использую Stanford CoreNLP для анализа своих предложений, и он работает на удивление хорошо. Но мне интересно: поскольку CoreNLP содержит вероятностный синтаксический анализатор, как программа справляется с неоднозначностями?

«Я видел девушку в очках».

(1) Если я правильно понимаю, CoreNLP печатает САМОЕ вероятно дерево. Так что нет возможности проверить, есть ли двусмысленность, не так ли? (2) Означает ли это, что CoreNLP игнорирует синтаксические двусмысленности?


person Lorento Palanomi    schedule 26.07.2016    source источник


Ответы (1)


Да, CoreNLP выберет одну из двух интерпретаций и вернет ее. Тем не менее, важно отметить, что «наиболее вероятное дерево» - это то, которое синтаксически наиболее вероятно (т. Е. Больше всего похоже на деревья, которые можно увидеть в обучающих данных), а не наиболее вероятно на основе какого-либо вида реальные знания. Скорее всего, фразы «Я ел торт с вишней» и «Я ел торт вилкой» будут иметь одинаковый синтаксический анализ.

person Gabor Angeli    schedule 26.07.2016