TTS发音是什么意思?

[编辑此段落]TTS概述

TTS是Text To Speech的缩写,即“从文本到语音”。是一部同时运用语言学和心理学的杰出作品。在内置芯片的支持下,它通过神经网络的设计,智能地将单词转换成自然的语音流。TTS技术可以实时转换文本文件,转换时间以秒计算。在其独有的智能语音控制器的作用下,文本输出的语音节奏流畅,让听者在听信息时感觉自然,没有机器语音输出的冷漠和涩涩。TTS语音合成技术即将覆盖国标中的第一个和第二个汉字,有英文界面,自动识别中英文,支持中英文混读。所有语音均以真实普通话发音,实现了每秒120-150个汉字的快速语音合成,朗读速度达到每秒3-4个汉字,让用户听到清晰悦耳的音质和连贯流畅的语调。现在少数MP3随身听有TTS功能。

TTS是一种语音合成应用程序,它将存储在计算机中的文件(如帮助文件或网页)转换为自然的语音输出。TTS可以帮助有视觉障碍的人阅读计算机上的信息,或者它可以简单地用于增加文本文档的可读性。今天的TTL应用包括语音驱动的电子邮件和语音感应系统。TTS通常与语音识别程序一起使用。现在有很多TTS产品,包括Read Please 2000,Proverbe语音单元,以及Next Up技术的TextAloud。朗讯,Elan,还有at & amp;t有自己的语音合成产品。

除了TTS软件,许多厂商还提供硬件产品,包括以色列WizCom Technologies的Quick Link Pen,这是一种类似笔的设备,可以扫描和阅读文本。还有鸵鸟软件的Road Runner,可以读取ASCII文本的手持设备;另外还有美国DEC公司的DecTalk TTS,是一种可以替代声卡的外接硬件设备。它包含一个内部软件设备,可以与个人计算机自带的声卡一起工作。

[编辑此段]TTS分析

TTS文语转换应用广泛,包括电子邮件阅读、IVR系统的语音提示等。目前,IVR系统已经广泛应用于各个行业(如电信、交通等)。).

TTS的关键技术是语音合成。早期的TTS一般是用专用芯片来实现的,比如德州仪器的TMS50C10/TMS50C57,飞利浦的PH84H36,但主要应用在家用电器或儿童玩具中。

基于微机应用的TTS一般由纯软件实现,主要包括以下几个部分:

文本分析——对输入的文本进行语言学分析,逐句进行词法、语法、语义分析,确定句子的底层结构和每个词的音素构成,包括断句、分词、多音字处理、数字处理、缩写处理等。

●语音合成-从语音合成数据库中提取与处理后的文本相对应的单词或短语,并将语言描述转换为语音波形。

●韵律处理——合成语音的质量是指语音合成系统输出的语音质量,一般从清晰度(或可懂度)、自然度、连贯性等方面进行主观评价。清晰度是正确听有意义单词的百分比;自然度用于评价合成语音的质量是否接近人声,合成词的语调是否自然。连贯性用于评价合成句子的流畅性。

要合成高质量的语音,使用的算法极其复杂,所以对机器的要求也非常高。算法的复杂度决定了目前微机并发多通道TTS的系统容量。

TTS在CTI应用中的基本框架

在一般的CTI应用系统中,会有IVR(交互式语音应答系统)。IVR系统是呼叫中心的重要组成部分。通过IVR系统,用户可以通过按下带有音频的按钮来输入信息,并从系统中获得预先录制的数字或合成语音信息。具有TTS功能的IVR可以加快服务速度,节省服务成本,使IVR可以为呼叫者提供7*24小时服务。

目前常见的IVR系统大多由插在通用工控机平台上的语音卡组成,支持中文语音合成TTS等技术。

包括TTS服务在内的典型电话服务流程可分为:

当用户拨入时,系统IVR会响应并获取用户的密钥等信息。

IVR根据用户的关键信息向数据库服务器申请相关数据。

数据库服务器向IVR返回文本数据。

IVR通过其TCP通信接口将文本信息发送给TTS服务器。

TTS服务器通过TCP通信接口将用户文本合成的语音数据段发送给IVR服务器。

IVR服务器将分段的语音数据组装成独立的语音文件。

IVR向电话用户播放相应的语音文件。

一般的公网接入(IVR)多采用工控机+语音卡,合成的语音数据通过局域网传输到IVR。这种结构只适用于简单的应用。