一、课程简介
通过学习本案例,可掌握语音特征提取、LSTM模型构建与训练、语音识别的相关知识与技能,为后续相关课程内容学习奠定基础。 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。通过语音识别实现数字的识别,可以视作语音识别的基础之一。本案例选取3900条来自18个人朗读的英语数字语音,提取英语数字语音数据的MFCC特征,并基于TensorFlow框架,构建LSTM深度学习模型,完成语音数字的识别。
本案例的主要分析目标如下。
(2)基于TensorFlow框架,构建LSTM深度学习模型,完成语音数字的识别。
二、技术点
libsora、MFCC、LSTM、load_model。
三、建议前置课程