Выбор анализатора для полнотекстового поиска lucene.net в книгах

Я использую Lucene с vb.net. Я хочу выполнить полнотекстовый поиск некоторых книг, включая книги на арабском и английском языках. Я не очень уверен в выборе анализатора, который мне следует использовать. Было бы здорово, если бы кто-нибудь порекомендовал мне правильный анализатор из своего опыта. Спасибо


person user934820    schedule 01.04.2015    source источник


Ответы (1)


Если вы хотите включить основы и другие правила анализа для конкретного языка и можете определить, на каком языке находится документ или запрос, вы можете использовать 1_netnew SnowballAnalyzer(myVersion, "English")1_analysisnew SnowballAnalyzer(myVersion, "English")1_a_rnew SnowballAnalyzer(myVersion, "English")1_arabic_analyzer.html" rel="nofollow">ArabicAnalyzer для документов и запросов на арабском языке и 1_netnew SnowballAnalyzer(myVersion, "English")1_analysisnew SnowballAnalyzer(myVersion, "English")1_snowballnew SnowballAnalyzer(myVersion, "English")1_snowball_analyzer.html" rel="nofollow">SnowballAnalyzer для документов и запросов на английском языке (например: new SnowballAnalyzer(myVersion, "English")).

Если вы хотите использовать анализ, не зависящий от языка, для всех из них, вам обычно следует придерживаться 1_netnew SnowballAnalyzer(myVersion, "English")1_analysisnew SnowballAnalyzer(myVersion, "English")1_standardnew SnowballAnalyzer(myVersion, "English")1_standard_analyzer.html" rel="nofollow">Стандартный анализатор.

person femtoRgon    schedule 01.04.2015
comment
Спасибо, я думаю StandardAnalyzer. Не могли бы вы уточнить некоторые плюсы и минусы этого. Это работает со специальными символами? - person user934820; 01.04.2015