Speech-to-Text-WaveNet: сквозное распознавание речи на уровне предложения на английском языке с использованием DeepMind WaveNet

Реализация распознавания речи с тензорным потоком на основе DeepMind WaveNet: Генеративная модель для Raw Audio. (Далее документ)

Хотя ibab и tomlepaine уже реализовали WaveNet с tenorflow, они не реализовали распознавание речи. Поэтому мы решили реализовать это сами.

Подробнее об этом очень крутом проекте читайте здесь.

Вскоре я интегрирую эту функциональность в свой образ докера для разработки Open Self Driving Car, чтобы обеспечить возможность автономных голосовых команд.

Для начала ознакомьтесь с моей первой статьей из этой серии:

Зачем нужна разработка Self Driving Car с открытым исходным кодом и с чего начать