Я искал CMU pocketsphinx для распознавания голоса. В идеале я хочу иметь возможность распознавать структуры предложений по строке «Пожалуйста, возьмите», где находится большой список объектов (~ 200), используя живой звук в качестве ввода. Изначально у меня были большие трудности с установкой pocketsphinx на Убунуту, в конце концов я смог заставить его работать с помощью gstreamer. Теперь, когда это работает, я работаю над повышением точности. Я хотел бы включить грамматику jsgf, но не могу найти никаких инструкций или примеров кода, и в настоящее время я в недоумении.
Буду очень признателен за любую помощь.