人工智能语音合成和识别技术

来源:本站    分类:行业资讯      发布时间:2023-04-07     浏览次数:225

多年来,微软一直在探索人工智能语音合成和识别技术。Azure Neural TTS(文本到语音,语音合成)和STT(语音到文本,语音识别)支持超过140个语言区域,支持400多个声音。


近两年来,微软加大了对汉语方言智能语音的研究力度。微软宣布在语音合成方面支持两种中国方言,吴语和粤语,以及西南官话、东北官话,冀鲁官话和中原官话(包括河南和陕西)。在语音识别方面,支持吴语、粤语和西南官话。
根据微软的说法,中文是世界上最古老的语言之一。由于历史和地理条件的影响,出现了许多代表地域文化特色的方言。自2017年以来,微软一直致力于推动AI for Good计划,其中包括:通过提供前沿技术、资源和专业知识,保护人类遗产,创造一个更加可持续和便利的世界。微软还将继续投资方言智能语音的研究,帮助保护和传承中国传统文化。
除了方言,古典诗词也是文化传承的重要载体。IT House了解到,微软可以通过学习大量诗歌朗诵者的语音数据,让人工智能更好地表达诗歌的节奏、停顿和情感。微软的智能语音现在支持传统诗歌、现代诗歌、五字和七字节奏等智能语音的背诵。