Я создал свой список, содержащий несколько арабских слов, затем добавил запись, связанную с этим списком, в файле def и поместил два файла в один и тот же каталог, а затем в свой код Java, который я написал:
FeatureMap params = Factory.newFeatureMap();
params.put("encoding", "UTF-8");
params.put("listsURL","file:/D:/ThesisProj/Gazetteers/lists.def");
LanguageAnalyser gazetteer = (LanguageAnalyser)Factory.createResource("arabic.ArabicGazetteer",params);
gazetteer.init();
когда список и файл - я сопоставляю слова из него - содержащие английские слова, сопоставление выполняется, поскольку полученные аннотации имеют аннотацию поиска с совпадающими словами, но когда я пытаюсь использовать арабский язык и иметь только арабские слова как в списке, так и сравнивая файл, в полученных аннотациях нет аннотации поиска, может ли кто-нибудь помочь мне заставить GATE распознавать арабские символы и сопоставлять их, я думаю, что utf-8 не подходит