系统特点:
1.同时支持windows&Linux;
2.识别率高:
语音识别率超97%<;
3.识别速度快:
较快的识别速度实时率可以达到0.2-0.3;
4.模型丰富:
数据、算法、模型积淀,声学语音模型覆盖各行各业;
5.多语种支持:
支持英语等外语种、维藏蒙彝朝等少数民族语、粤语四川话闽南话等方言的识别;
模型可定制,可根据客户应用场景进行模型的定制训练,迅速提高领域内识别率;
6.支持实时/离线识别:
在离线语音质检转写场景中,能够单通道录音的语音识别进行话者分离,情绪检测,语速检测;
7.支持模型训练:
针对特定的领域,可以针对性的训练专门的语言模型和声学模型这样对于集中在这个领域的说话内容就会获得更好的识别率。支持根据生产录音,进行进一步训练优化。包括语言模型训练和声学模型训练,提升语音识别的准确率。训练形式可支持本地化训练或签订保密协议远程训练;
8.支持多模型:
全智能能力平台支持挂载多个模型支持根据不同的场景启用相应的模型;
9.高识别率:
高识别率:支持对大量的行业词库进行专业模型训练,包括文本和语音文件训练;
高处理性能: 语音识别具有高识别速度,实时率0.2-0.3,并且能够稳定支持100路并发;
系统扩容:支持横向扩容,满足甲方业务增长的需求;
10.支持多接口调用:
支持开放友好的接入方式支持HTTP、TCP、MRCP、webservice、socket等接口支持使用异步通信库获取结;
支持自动加标点语音识别引警可以自动对识别结果加上标点符号,此过程主要利识别结果的语义进行处理的,也利用了声学上的一些特性,例如停顿长度等;
11.支持流式/非流式识别:
非流式识别: 输入一整段语音,引擎进行特征提取和解码的识别工作,并返回这段语音的识别结果;
流式识别: 可以分段输入语音,最后得到结果。引擎在获得分段的输入语音的同时,就可以同步地对这段数据进行特征提取和解码工作,而不用等到所有数据都获得后再开始工作。因此这样就可以在最后一段语音结束后,仅延迟很短的时间即可返回最终识别结果。这种流式输入方式能缩短整体上获得最终结果的时间,极大地提升用户体验;
12.支持实时/离线识别:
实时识别: 语音识别引擎在每次获得分段输入的语音后,如果已经开始检测到语音端点并加以识别,就会实时返回当前已识别出来的结果,而不是等到检测到语音结束端点,再输出本段语音的完整结果;
离线转写: 语音识别引擎支持提供离线转写服务,可以将呼叫中心产生的录音转写成文本;