TTS 3.0引擎及语音库,是基于IBM TTS 语音合成引擎的,适合东进语音卡DBDK开发包配合使用。
产品的功能
- 使用最新的IBM TTS6.4.8转换引擎,提供完善的语言分析能力和较好的语音的合成质量;
- 自然度高的拟人化语音数据(采用语音库数据合成);
- 提供多种的转换方式和输出方式;
- 提供内存字符串和文本文件(*.txt格式)输入;
- 支持简体中文和繁体中文及英文输入;
- 同时支持普通话和英文混合发音;
- 语音转换出声音只支持女声。
实现的基本功能
- 语音卡(D161A/D081A)多通道实时播放输入文本(内存字符串、文本文件);
- 语音卡(D161A/D081A)多通道实时转换输入文本(内存字符串、文本文件)为语音文件(a-Law PCM、Windows Wave);
- 计算机声卡播放输入文本(内存字符串、文本文件)。
性能指标
同时启动多个引擎实例,并对每个引擎输入不同类型的大量文本,下表为其测试数据:
平均响应时间 (单位:秒) | 支持的引擎实例数 M | 有效端口数目 N |
<= 1 | 10~12 | 37 ~ 45 |
< = 3 | 20~24 | 75~90 |
注:
- 平均响应时间 = 多个实例自输入文本后到第一句话开始输出所需时间的平均值。
- 有效端口数目的经验值:N =支持的引擎实例数M * 3 / 0.8
输入输出参数
- 输入:内存字符串指针、文本文件名、输出语音文件名、输出语音语速及音量参数
- 输出:语音资源、语音文件
产品的优势和局限
DJTTS3.0与DJTTS2.0和DJTTS1.0对比的优劣势如下:
优势:
- DJTTS3.0稳定性较好,连续7*24个小时的测试,未出现内存泄漏、死机现象;
- 音质较好(以语音库提供转换,DJTTS1.0 和DJTTS2.0是通过软件实时转换);
- 提供(VC、VB、Delphi、C++Builder)编程接口;
- 提供多种方式的转换接口;
- DJTTS3.0新增加了对D系列数字卡的支持功能
局限性:
- 只有女性声音输出
- 支持的操作系统较少(不支持WINDOWS NT)下运行
- DJTTS3.0产品不是DJTTS2.0的升级产品,不能通过直接升级的方式从DJTTS2.0升级到DJTTS3.0
产品的使用注意事项
- 需DJDBDK3.1.3或以上支持;
- 支持Windows2000Server / Professional+SP2以上;
- 系统内存需要512M;
产品技术基础知识
- 东进D161A/D081A开发接口;
- TTS基本应用功能。