Публикации по теме 'lexical-analysis'
Обработка естественного языка (NLP): расширенное руководство для начинающих (часть 13) — Лексическая обработка…
В этой многосекционной итеративной серии вы познакомитесь с лексической обработкой: токенизация. Является продолжением 12 части серии.
В предыдущем разделе вы видели проблему избыточных токенов. Это приведет к неэффективной модели при создании детектора спама. Основание гарантирует, что к различным разновидностям слова, например, "теплый", "теплее", "согревающий" и "согретый", обращается лексема единственного числа - "теплый", в свете того факта, что все они обращаются к одним и..
Вопросы по теме 'lexical-analysis'
Программа, которую я сделал с помощью flex / yacc, не всегда распознает идентификаторы
Я сделал программу, которая должна распознавать простую грамматику. Когда я ввожу то, что, по моему мнению, должно быть действительным утверждением, я получаю сообщение об ошибке. В частности, если я начинаю с идентификатора, я автоматически получаю...
1181 просмотров
schedule
07.10.2021
Как мне передать этот ввод?
В настоящее время у меня есть рабочий, простой язык, реализованный на Java с использованием ANTLR. Я хочу встроить его в обычный текст, аналогично PHP.
Например:
Lorem ipsum dolor sit amet
<% print('consectetur adipiscing elit'); %>...
597 просмотров
schedule
06.09.2021
ВЫБРАТЬ * против ВЫБРАТЬ *
Вчера коллега показал мне следующий запрос postgres. Мы оба были удивлены, что это сработало:
SELECT* FROM mytable;
Поскольку я недавно написал синтаксический анализатор для другого языка, я пытаюсь более глубоко понять, почему этот запрос...
311 просмотров
schedule
19.11.2021
Несбалансированная скобка в Python re.match
Возникла действительно странная проблема с использованием re.match() . Вот мой код:
for rule in rules:
# print (rule, ", ", item)
if re.match(rule, item):
tokenLine.append(self.ruleDictionary[rule])...
558 просмотров
schedule
19.11.2021
Взаимодействие Java CUP и JFlex
Я подумываю использовать генератор парсера CUP для проекта. Чтобы правильно проанализировать некоторые конструкции языка, который я собираюсь компилировать, мне понадобится лексер (сгенерированный JFlex) для использования информации из таблицы...
2039 просмотров
schedule
20.11.2021
nlp - Как определить, указывает ли слово в предложении на цвет / часть тела / транспортное средство
Итак, как следует из названия, я хотел бы знать, указывает ли определенное слово в предложении на
1] Цвет
The grass is green.
Следовательно "зеленый" - это цвет
2] Часть тела
Her hands are soft
Следовательно, «руки» - это часть...
1563 просмотров
schedule
28.11.2021
Что означает yytext [0]?
Что означает yytext [0]? А зачем использовать в программе lex и yacc? Я учусь, так что не возражайте, если это будет глупый вопрос.
21049 просмотров
schedule
27.09.2021
Какое регулярное выражение для сопоставления пробелов между словами в предложении FLEX?
Я хочу сначала сопоставить пробелы между словами, а затем подсчитать общее количество пробелов в предложении. Я пытаюсь сделать это ниже,
%{
#undef yywrap
#define yywrap() 1
int VowelCount = 0;
int ConsonantCount=0;
int CountWhiteSpace=0;
int...
40 просмотров
schedule
23.10.2021
лексический анализатор в схеме
привет, ребята, я очень новичок в схеме программирования, поэтому я пытаюсь построить лексический анализатор в схеме, которая в основном читает список, например < SUM + 34 > , и вывод будет примерно таким
{ is the left bracket
SUM is an...
1027 просмотров
schedule
06.03.2022
Ошибка компиляции flex (лексический анализатор)
Я пытаюсь установить flex (лексический анализатор, а не программу Adobe) на свой компьютер с Windows. У меня установлен MSYS. Я распаковываю flex, ./configure его, но когда я пытаюсь это сделать, я получаю эту ошибку:
In file included from...
1009 просмотров
schedule
18.03.2022
Регулярное выражение, чтобы понять, что в начале строки нет пробела (flex)
Я работаю над лексером для грамматики Python (написанной на Flex) для класса построения компилятора, и у меня возникают проблемы с получением правильно работающего регулярного выражения, чтобы поймать, когда в начале строки нет пробела (для учета для...
764 просмотров
schedule
29.03.2022
Арабская лемматизация и Стэнфордский НЛП
Я пытаюсь сделать лемматизацию, т.е. определить лемму и, возможно, арабский корень глагола, например: يتصل ==> лемма (инфинитив глагола) ==> اتصل ==> корень (трехбуквенный корень / джидр хулати) == > و ص ل
Как вы думаете, Стэнфордский НЛП может...
3643 просмотров
schedule
08.04.2022
C Лексический анализатор на питоне
Я создаю лексический анализатор C, используя python как часть разработки синтаксического анализатора. Здесь в моем коде я написал несколько методов для определения ключевых слов, чисел, операторов и т. д. После компиляции не отображается ошибка. Во...
7996 просмотров
schedule
24.04.2022
FsLex — разница между двумя строками
У меня есть пара токенов:
PNAME и ENAME - оба являются строками.
Теперь я хочу настроить 2 правила в своем лексере, чтобы сопоставить эти токены.
Первое правило ( PNAME ) должно совпадать, когда строка состоит из символов a–z и...
160 просмотров
schedule
23.04.2022
Базовый лексический анализатор для сложения и умножения на Java
Я хотел бы сделать очень простой лексический анализатор, но я немного застрял. Допустим, у меня есть только две арифметические операции (сложение и умножение) и два целых числа. Сложение или умножение выполняется двумя операндами (порядок не имеет...
876 просмотров
schedule
23.04.2022
Спящий режим поиска Lucene. Предложение, но почти как SQL LIKE
Я впервые имею дело с оптимизированной функциональностью поиска, и часть моих знаний связана с разработкой Android, но я готов принять приключение поиска в спящем режиме. Я понимаю функциональность запроса SQL «LIKE», что он делает и его ограничения,...
243 просмотров
schedule
06.05.2022
Лексический анализ — извлечение токенов из DFA, созданных напрямую
Я читал книгу о драконах и был действительно заинтересован в алгоритме, который преобразует регулярное выражение непосредственно в DFA (без явного NFA). Предположим, мой лексический макет файла похож на lex:
...
%%
if {...
57 просмотров
schedule
14.05.2022
Создание лексического анализатора на Java
В настоящее время я изучаю лексический анализ в проектировании компиляторов. Чтобы понять, как на самом деле работает лексический анализатор, я пытаюсь построить его сам. Планирую построить его на Java.
На вход лексического анализатора поступает...
2507 просмотров
schedule
27.05.2022
FLEX: есть ли способ вернуть сразу несколько токенов
Во flex я хочу вернуть несколько токенов для одного совпадения с регулярным выражением. Есть ли способ сделать это?
2872 просмотров
schedule
08.06.2022
Используете lex / создаете сканер?
Недавно я изучал теорию компиляторов о лексическом анализе. Как я понял, есть несколько способов построения лексического сканера, например:
Использование Lex / Flex для автоматического создания сканера.
Создайте свой собственный. В примерах я...
497 просмотров
schedule
08.06.2022