Публикации по теме 'lexical-analysis'


Обработка естественного языка (NLP): расширенное руководство для начинающих (часть 13) — Лексическая обработка…
В этой многосекционной итеративной серии вы познакомитесь с лексической обработкой: токенизация. Является продолжением 12 части серии. В предыдущем разделе вы видели проблему избыточных токенов. Это приведет к неэффективной модели при создании детектора спама. Основание гарантирует, что к различным разновидностям слова, например, "теплый", "теплее", "согревающий" и "согретый", обращается лексема единственного числа - "теплый", в свете того факта, что все они обращаются к одним и..

Вопросы по теме 'lexical-analysis'

Программа, которую я сделал с помощью flex / yacc, не всегда распознает идентификаторы
Я сделал программу, которая должна распознавать простую грамматику. Когда я ввожу то, что, по моему мнению, должно быть действительным утверждением, я получаю сообщение об ошибке. В частности, если я начинаю с идентификатора, я автоматически получаю...
1181 просмотров
schedule 07.10.2021

Как мне передать этот ввод?
В настоящее время у меня есть рабочий, простой язык, реализованный на Java с использованием ANTLR. Я хочу встроить его в обычный текст, аналогично PHP. Например: Lorem ipsum dolor sit amet <% print('consectetur adipiscing elit'); %>...
597 просмотров
schedule 06.09.2021

ВЫБРАТЬ * против ВЫБРАТЬ *
Вчера коллега показал мне следующий запрос postgres. Мы оба были удивлены, что это сработало: SELECT* FROM mytable; Поскольку я недавно написал синтаксический анализатор для другого языка, я пытаюсь более глубоко понять, почему этот запрос...
311 просмотров
schedule 19.11.2021

Несбалансированная скобка в Python re.match
Возникла действительно странная проблема с использованием re.match() . Вот мой код: for rule in rules: # print (rule, ", ", item) if re.match(rule, item): tokenLine.append(self.ruleDictionary[rule])...
558 просмотров
schedule 19.11.2021

Взаимодействие Java CUP и JFlex
Я подумываю использовать генератор парсера CUP для проекта. Чтобы правильно проанализировать некоторые конструкции языка, который я собираюсь компилировать, мне понадобится лексер (сгенерированный JFlex) для использования информации из таблицы...
2039 просмотров

nlp - Как определить, указывает ли слово в предложении на цвет / часть тела / транспортное средство
Итак, как следует из названия, я хотел бы знать, указывает ли определенное слово в предложении на 1] Цвет The grass is green. Следовательно "зеленый" - это цвет 2] Часть тела Her hands are soft Следовательно, «руки» - это часть...
1563 просмотров

Что означает yytext [0]?
Что означает yytext [0]? А зачем использовать в программе lex и yacc? Я учусь, так что не возражайте, если это будет глупый вопрос.
21049 просмотров
schedule 27.09.2021

Какое регулярное выражение для сопоставления пробелов между словами в предложении FLEX?
Я хочу сначала сопоставить пробелы между словами, а затем подсчитать общее количество пробелов в предложении. Я пытаюсь сделать это ниже, %{ #undef yywrap #define yywrap() 1 int VowelCount = 0; int ConsonantCount=0; int CountWhiteSpace=0; int...
40 просмотров
schedule 23.10.2021

лексический анализатор в схеме
привет, ребята, я очень новичок в схеме программирования, поэтому я пытаюсь построить лексический анализатор в схеме, которая в основном читает список, например < SUM + 34 > , и вывод будет примерно таким { is the left bracket SUM is an...
1027 просмотров
schedule 06.03.2022

Ошибка компиляции flex (лексический анализатор)
Я пытаюсь установить flex (лексический анализатор, а не программу Adobe) на свой компьютер с Windows. У меня установлен MSYS. Я распаковываю flex, ./configure его, но когда я пытаюсь это сделать, я получаю эту ошибку: In file included from...
1009 просмотров
schedule 18.03.2022

Регулярное выражение, чтобы понять, что в начале строки нет пробела (flex)
Я работаю над лексером для грамматики Python (написанной на Flex) для класса построения компилятора, и у меня возникают проблемы с получением правильно работающего регулярного выражения, чтобы поймать, когда в начале строки нет пробела (для учета для...
764 просмотров
schedule 29.03.2022

Арабская лемматизация и Стэнфордский НЛП
Я пытаюсь сделать лемматизацию, т.е. определить лемму и, возможно, арабский корень глагола, например: يتصل ==> лемма (инфинитив глагола) ==> اتصل ==> корень (трехбуквенный корень / джидр хулати) == > و ص ل Как вы думаете, Стэнфордский НЛП может...
3643 просмотров

C Лексический анализатор на питоне
Я создаю лексический анализатор C, используя python как часть разработки синтаксического анализатора. Здесь в моем коде я написал несколько методов для определения ключевых слов, чисел, операторов и т. д. После компиляции не отображается ошибка. Во...
7996 просмотров
schedule 24.04.2022

FsLex — разница между двумя строками
У меня есть пара токенов: PNAME и ENAME - оба являются строками. Теперь я хочу настроить 2 правила в своем лексере, чтобы сопоставить эти токены. Первое правило ( PNAME ) должно совпадать, когда строка состоит из символов a–z и...
160 просмотров
schedule 23.04.2022

Базовый лексический анализатор для сложения и умножения на Java
Я хотел бы сделать очень простой лексический анализатор, но я немного застрял. Допустим, у меня есть только две арифметические операции (сложение и умножение) и два целых числа. Сложение или умножение выполняется двумя операндами (порядок не имеет...
876 просмотров
schedule 23.04.2022

Спящий режим поиска Lucene. Предложение, но почти как SQL LIKE
Я впервые имею дело с оптимизированной функциональностью поиска, и часть моих знаний связана с разработкой Android, но я готов принять приключение поиска в спящем режиме. Я понимаю функциональность запроса SQL «LIKE», что он делает и его ограничения,...
243 просмотров

Лексический анализ — извлечение токенов из DFA, созданных напрямую
Я читал книгу о драконах и был действительно заинтересован в алгоритме, который преобразует регулярное выражение непосредственно в DFA (без явного NFA). Предположим, мой лексический макет файла похож на lex: ... %% if {...
57 просмотров

Создание лексического анализатора на Java
В настоящее время я изучаю лексический анализ в проектировании компиляторов. Чтобы понять, как на самом деле работает лексический анализатор, я пытаюсь построить его сам. Планирую построить его на Java. На вход лексического анализатора поступает...
2507 просмотров
schedule 27.05.2022

FLEX: есть ли способ вернуть сразу несколько токенов
Во flex я хочу вернуть несколько токенов для одного совпадения с регулярным выражением. Есть ли способ сделать это?
2872 просмотров
schedule 08.06.2022

Используете lex / создаете сканер?
Недавно я изучал теорию компиляторов о лексическом анализе. Как я понял, есть несколько способов построения лексического сканера, например: Использование Lex / Flex для автоматического создания сканера. Создайте свой собственный. В примерах я...
497 просмотров