新浪游戏|新浪VR频道

新浪VR

微软利用AI技术使文本转语音只需20分钟

2019-05-27 15:20 新浪VR

0

　　文本到语音的转换正变得越来越简单，但有一个问题：仍然需要大量的培训时间和资源来生成自然声音输出。微软和中国的研究人员可能有一个更有效的方法。他们设计了一种文本到语音的人工智能，只需200个语音样本（约20分钟）和匹配的转录，就能生成逼真的语音。

　　该系统部分依赖于变压器，或深度神经网络，大致模拟大脑中的神经元。变压器像突触链接一样，动态地衡量每一个输入和输出，帮助它们非常高效地处理即使是很长的序列，比如一个复杂的句子。再加上一个去噪编码器组件，人工智能可以用相对较少的资源做很多事情。

　　这一结果并不完美，虽然有轻微的机器人声音，但它们非常准确，文字的清晰度为99.84%。更重要的是，这可以使文本到语音更容易访问。你不需要花太多精力去获得真实的声音，让小公司甚至业余爱好者都能做到。这对未来也是一个好兆头。研究人员希望对不匹配的数据进行训练，因此创造现实对话所需的工作可能更少。

: ARM发布新款芯片可使手机AI速度提升60%

05月27日 14:560

: 获数博会“领先科技成果”奖搜狗AI合成主播展示中国AI新力量

05月27日 13:190

: "艾米机器人"引领AI新时代

05月27日 10:520

: 索尼或将AI集成到相机传感器

05月27日 10:190