Skip to content
nl8590687 edited this page Jul 29, 2018 · 5 revisions

Introduction 本项目介绍

ASRT_SpeechRecognition 是一个基于深度学习的语音识别系统

本项目使用Keras、TensorFlow基于长短时记忆神经网络和卷积神经网络以及CTC进行制作。

This project uses keras, TensorFlow based on LSTM, CNN and CTC to implement.

Model 模型

Speech Model 语音模型

CNN + LSTM/GRU + CTC

用于实现将声学信号转换为拼音标签序列

  • 关于下载已经训练好的模型的问题

可以在Github本仓库下release里面的发布的软件的压缩包ASRT_vXX.XX.zip里获得完整源程序,包含已经训练好的模型。

Language Model 语言模型

基于概率图的马尔可夫模型

用于实现将拼音标签序列转换为最终对应的中文文本,就是识别出来的文字