基于DSP的中文语音合成系统设计方案

发布时间:2015-11-17 阅读量:1097 来源: 我爱方案网 作者:

【导读】DSP芯片,即数字信号处理器,是专门为快速实现各种信号处理算法而设计的、具有特殊结构的微处理器,其处理速度比最快的CPU还快10~50 倍。本文将介绍一种基于DSP的中文语音合成系统实现方法。 
 
1 系统总体方案

 

语音合成的最大特点就是要从有限的存储单元中合成出无限字汇的连续语句来。为了做到这一点,本系统设计了由:

(1)前端预处理模块将输入文本文件转换成系统可以处理的标准格式;
(2)韵律规则库给出当前语言环境下各个音节的韵律特征参数;
(3)语音合成器根据给定的韵律特征参数对原始语音库中相应语音单元的声学参数进行调整;
(4)将经过调整的各个语音单元拼接在一起,得到相应于输入文本的连续语音输出等4个基本流程组成。

系统基本原理框图如图1所示。
 

图1:系统基本原理框图

2 硬件系统设计

*基金项目:湖南省教育厅(03C025)

该中文语音合成系统的目的是对输入的文本文件能够清晰地、自然地、能懂地以连续语音地形式输出。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行 显示,再送TMS320VC5402处理,最后将合成结果输出。硬件结构框图如图2所示。

图2:硬件系统结构框图

2.1 键盘电路和显示电路

AT89S52的键盘接口电路是采用中断方式的,有键按下时,就产生中断请求,进入中断处理,然后通过查询P1.0和P1.1的情况,进行相应的处理。用电阻和电容够成了消抖电路,以防止电路的误操作。

AT89S52把从键盘输入的文本信息送给LCD显示,同时把数据写到外部存储器CY7C133,然后TMS320 VC5402读取CY7C133上的信息进行处理。LCD的指令格式如表1所示:


表1 :LCD的指令格式


其中RS, R/W共同决定选择哪一个寄存器,如表2所示:

表2: 寄存器选择

2.2 TMS320VC5402与AT89S52的通信

AT89S52和TMS320VC5402各自独立工作,其信息和数据交换通过共享一片外部存储器来实现,它们之间信号联络通过硬连接和软件判断来实现。

外部存储器采用的是CY7C133,它是高速的2K X 16bit的静态异步双端口RAM,其存储速度为25ns。它有两套独立的地址线、数据线和控制信号线,允许两个控制器件中的数据通过共同连接的存储器来进行通信。该双端口RAM允许两个控制器同时读取任何存储单元(包括同时读同一单元),但不允许同时写或者一读一写统一地址单元。

对于TMS320VC5402,数据存储器CY7C133的对应地址为4000H~47FFH。

对于AT89S52,数据存储器CY7C133的对应地址为2000H~27FFH。

3 软件系统设计

汉语作为一种有调语言,其韵律特征非常复杂。为了从有限的存储单元中合成出无限字汇的连续语句来,必须在一定的韵律规则下对语音库单元的韵律参数进行调整,以得到符合当前语流环境的音变单元[3]。

根据得到音变单元的方法不同,可将语音合成器分成两种类型:(1)波形拼接合成;(2)参数合成(又称源/滤波器合成)。本系统采用波形拼接合成的方法直接对波形的时域和频域波形进行调整以得到所需要的音变单元。

简单的波形拼接法很难进行音高和音长(时间长度)调整。因此,本系统采用中性语调音节直接拼接配合基音同步波形叠加(PSOLA)算法,并用码激励线性预测(CELP)编码方法对原始采样音库进行编码压缩的方法。基本流程图如图3所示。
 

图3:系统基本流程图

4 结束语

本系统利用SCM实时显示输入的文本文件,能够将合成语音和输入文本文件实现对比输出,直观性强;合成算法运算复杂度低,能够用尽量小的音库来实现对容量有限的存储空间的占用程度的要求具有清晰度、能懂度和自然度高。


推荐阅读:

 

行驶车辆检测器设计方案
基于LabVIEW的车辆监测系统设计方案
动力电池管理系统保护设计方案
基于无线传感网技术的智能停车系统设计
数据中心节能改造的七种解决方案

相关资讯
中国智能手机市场结束增长周期,2025年Q2出货量同比收缩4%

国际数据公司(IDC)最新发布的2025年第二季度中国智能手机市场追踪报告显示,该季度国内手机整体出货量约6900万台,较去年同期下降4%。此次下滑终结了自2023年第四季度以来连续六个季度的增长态势,标志着市场进入周期性调整阶段。

ASML 2025Q2业绩创新高,High NA EUV光刻机首交付,地缘风险引发市场担忧

全球半导体设备龙头ASML公布2025年第二季度财报,核心指标表现亮眼。报告期内实现净销售额77亿欧元,同比增长23.21%;净利润达22.9亿欧元,同比大幅增长44.9%。毛利率53.7%超出预期,新增订单额激增至55.41亿欧元。技术里程碑方面,全球首台第二代High NA EUV光刻机TWINSCAN EXE:5200B完成交付。

低空经济崛起:2025无人机市场的关键应用与增长引擎解析

无人机系统(Unmanned Aerial Systems, UAS)作为“低空经济”的核心载体,正以前所未有的深度和广度渗透至众多产业领域,驱动效率变革与模式创新。其核心价值在于提供高灵活性、低成本和高精度的空中解决方案,显著提升了传统作业方式的效能。

柔性AMOLED强势登顶!2025年Q1智能手机面板份额突破63%,中国供应链强势助攻

市场研究权威机构Omdia最新报告揭示,智能手机显示技术格局已发生根本性转变。2025年第一季度,采用AMOLED面板的智能手机出货量在全球总市场中占比高达63%,较去年同期的57%实现大幅跨越,标志着AMOLED已成为无可争议的主流标准。与此同时,LCD面板的份额被压缩至37%,延续了长期的萎缩态势。

英伟达H20芯片获批对华销售 黄仁勋链博会宣布近期供货

7月16日,第三届中国国际供应链促进博览会(链博会)在京开幕。美国科技企业英伟达公司首席执行官黄仁勋身着唐装亮相开幕式,并在现场透露重要业务进展:该公司专为中国市场设计的H20人工智能芯片已获得美国商务部出口许可,即将启动批量供货。