谷歌云获得文本到语音的能力 与物联网设备 语音系统一起工作

2020-01-02 15:20:02 来源: INeng财经

周二,谷歌推出了云文本语音转换服务,允许开发者在多种产品中将文本转换成自然语音。根据谷歌的一篇博客文章,云文本到语音有许多用途,包括为呼叫中心的语音响应系统提供支持,并支持实时的自然语言对话。它还可以用来使物联网设备,包括电视、汽车和机器人,与用户进行对话。最后,云文本-语音转换可以将基于文本的媒体(如新闻文章或书籍)转换为语音格式(如播客或有声读物)。

该服务允许用户从12种语言和变体中选择32种不同的声音。它可以正确地发音复杂的文本,如姓名、日期、时间和地址,并允许用户自定义音高、讲话速度和音量增益,文章指出。云文本-语音转换还支持多种音频格式,包括MP3和WAV。

《华盛顿邮报》指出,云文本转换语音还包括用WaveNet构建的高保真语音,WaveNet是谷歌子公司DeepMind创建的原始音频生成模型。一年多前发布的WaveNet的原始版本使用训练在语音样本上的神经网络从无到有地创建原始音频波形。

《华盛顿邮报》指出,谷歌现在使用的是升级版的WaveNet,它运行在谷歌的云TPU基础设施上。这个更新的模型可以生成原始波形,比原来的速度快1000倍,并且可以在50毫秒内生成1秒的语音。它还可以产生高保真度、分辨率更高的波形,从而发出更自然的人声。

在测试中,人们给更新后的美国英语WaveNet语音的平均分是4.1分(满分5分),比标准语音高出20%以上,与人类语音的差距缩小了50%以上。

对于那些有兴趣了解更多,谷歌还提供了产品文档和定价。要开始使用公测版或者尝试新的语音,你可以访问云文本语音转换网站。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。