12月11日讯,依图科技宣布与微软Azure联合推出依图语音开放平台,与华为发布“智能语音联合解决方案”,未来依图会把语音识别技术提供给广泛的第三方应用开发者。
依图首席创新官吕昊博士表示,“语音识别技术经历了漫长的发展进化,但至今都只能在受限的场景下才能达到较好的使用效果。我们认为,核心技术的突破,依然是当前破局中文语音识别发展的关键。”
依图与微软联合推出依图语音开放平台,是基于微软Azure云,将语音识别技术能力开放给广泛的第三方应用开发者。在联合发布语音开放平台之后,依图与微软还将在智能语音领域展开更深层次的合作,共建AI生态。
携手华为联合发布的“智能语音联合解决方案”,是基于依图语音开放平台及华为全栈全场景N腾(Ascend)系列芯片和面向数据中心侧的Atlas 300 AI加速卡,将双方强大的技术研发能力与生态服务能力深度结合,形成软硬件一体化的联合解决方案。借助该解决方案,第三方应用开发者可进一步提升开发效率,从语音技术中受益。
对语音识别来说,语速、语态、语气、口音等都会显著影响识别的准确率。一般认为,字错率在低于3%时不会影响可读性,而超过15%则毫无可读性。
此次发布会上,依图科技公布了在中文语音识别技术上的新突破。在业内近期公开的AISHELL-2的三个测试子集,以及来自第三方的近场口音测试集、近场安静聊天测试集、语音节目测试集、电话测试集、远场测试集中,依图短语音听写字错率几乎在15%以下。
该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们。