基于语音识别芯片的语音识别系统设计

对于嵌入式系统，语音识别的硬件构成还有很多其他因素需要考虑。首先，由于成本限制，一般采用定点DSP，这意味着算法的复杂度有限；其次，产品化有各种严格的限制，需要高度集成的硬件DSP，所以最理想的硬件构成是系统级芯片。

一般采用16位结构的微控制器，将MCU、A/D、D/A、RAM、ROM集成在一个芯片上，集成度高。同时运算速度很高的16×16位乘法语音和内积运算指令，CPU最高可以达到49MHz的时钟，所以在复杂的数字信号处理中非常方便，比专用DSP芯片便宜很多。还拥有12位ADC和14位DAC保证音频精度，并配有带自动增益控制(AGC)的麦克风输入模式，为语音处理带来了极大的便利。它不仅具有体积小、集成度高、可靠性好的特点，而且具有中断处理能力强、性价比高、功能强、指令系统效率高、功耗低、电压低等特点，非常适合于嵌入式语音识别系统。

以SR160X为核心的嵌入式语音识别系统的硬件电路系统主要包括麦克风输入电路、ADC、DAC、功放输出电路、键盘电路以及各种通信电路等。语音保存在SPI闪存中。与说话人无关的语音识别只能在语音训练后识别。语音训练过程中建立的参考模式库和从待识别语音信号中提取的特征参数存储在扩展的SPI Flash中，这样可以保证掉电后重启继续识别。语音识别系统软件的主程序由语音训练程序、语音识别程序、语音回放程序、中断程序和初始化程序等子程序组成。由于嵌入式平台具有存储资源少、实时性要求高的特点，因此在保证识别效果的前提下，要尽可能对算法进行优化。

软件包括A/D转换、预加重、分帧加窗、端点检测、特征参数提取、放松端点限制的DTW算法，最后输出识别结果。

在应用层软件中，考虑到用户的实际需求，加入可以快速开发的虚拟软件开发技术，快速完成产品。