intro

Jump to bottom

nl8590687 edited this page Jul 29, 2018 · 5 revisions

Introduction 本项目介绍

ASRT_SpeechRecognition 是一个基于深度学习的语音识别系统

本项目使用Keras、TensorFlow基于长短时记忆神经网络和卷积神经网络以及CTC进行制作。

This project uses keras, TensorFlow based on LSTM, CNN and CTC to implement.

Model 模型

Speech Model 语音模型

CNN + LSTM/GRU + CTC

用于实现将声学信号转换为拼音标签序列

关于下载已经训练好的模型的问题

可以在Github本仓库下release里面的发布的软件的压缩包ASRT_vXX.XX.zip里获得完整源程序，包含已经训练好的模型。

Language Model 语言模型

基于概率图的马尔可夫模型

用于实现将拼音标签序列转换为最终对应的中文文本，就是识别出来的文字

对机器学习等方面有兴趣的欢迎来我的博客逛一逛：

AI柠檬一个科技爱好者的个人博客

也欢迎加入作者的技术博客交流QQ群：894112051