本文观点google voice和skype与google voice app由google voice 购买攻略站提供;
购买或批发Googlevoice号码请访问枫叶数卡
我感觉这应该是语音方面近5年到10年数得着的工作吧。这种方法是基于神经网络的HMM-free的方法。以前的基于神经网络的语音合成方法都要依赖于HMM强制对齐的结果,只能做frame-to-frame的回归。这种方法彻底摆脱了HMM,应该是基于神经网络的语音合成第一次做到end-to-end。
我认为这种方法应该跟给出前一帧预测下一帧的方法差不多,就是用当前帧之前的信息预测当前帧。能生成特定的语音,这个就类似与VAE,GAN都有conditional的版本,把想要生成的文本作为一部分输入。
如何评价谷歌