Speech-to-Text-WaveNet: сквозное распознавание речи на уровне предложения на английском языке с использованием DeepMind WaveNet
Реализация распознавания речи с тензорным потоком на основе DeepMind WaveNet: Генеративная модель для Raw Audio. (Далее документ)
Хотя ibab и tomlepaine уже реализовали WaveNet с tenorflow, они не реализовали распознавание речи. Поэтому мы решили реализовать это сами.
Подробнее об этом очень крутом проекте читайте здесь.
Вскоре я интегрирую эту функциональность в свой образ докера для разработки Open Self Driving Car, чтобы обеспечить возможность автономных голосовых команд.
Для начала ознакомьтесь с моей первой статьей из этой серии:
Зачем нужна разработка Self Driving Car с открытым исходным кодом и с чего начать