- 产品优势
- 应用场景
产品优势
-
-
定制识别及发音
语音识别可提供所需场景的音频及标注文件,定制专属识别模型,进一步提升识别准确率。 语音合成支持定制各种类型的男/女/童声,或学习说话人声音,可用于客服、阅读、虚拟人等场景
-
-
易接入
管控台可视化进行项目、场景、功能配置及自学习
并提供API和多种SDK,接入成本极低
-
-
识别准
数年持续提升准确率,与淘宝、菜鸟、高德使用一套服务
-
-
处理快
低延迟,秒级处理返回语音识别结果
应用场景
- 法庭庭审转写
- 智能客服质检
- 实时直播字幕及管理
- 业务电话内容分析
- 智能语音问询终端
- 小说新闻内容阅读
- 互联网娱乐解决方案

法庭庭审转写
传统法庭庭审内容通过书记员进行过程记录,记录过程有可能影响法庭进程,降低庭审效率;借助阿里云智能语音交互能力,在庭审中实现全程留痕、辅助会议快速生成记录,从而督促谈话过程更合规,且提升稿件整理效率。
能够解决
通过智能语音识别技术,实时转写庭审内容;
完整、准确还原庭审过程;
提高庭审效率及记录客观性。
推荐搭配使用
实时语音转写
一句话识别

智能客服质检
大量电话服务中,坐席出现违规或服务风险时也无法及时干预处理,造成客户及公司的损失;借助阿里云智能语音交互能力将实时通话录音转为文本,并进行文本分析,实现客服实时监控、离线质检等多种应用场景。
能够解决
通过智能语音识别,完成电话坐席的全量、实时质检;
避服务风险及服务违规,保证服务质量。
推荐搭配使用
实时语音转写

实时直播字幕及管理
用户在公共交通或公共场合看直播,无法打开音量,观看不过瘾。直播主播发生语言违规,造成不良舆情。主播流量、用户时长不稳定,内容运营缺少抓手。
能够解决
字幕方便用户无法收听音频时正常观看视频内容;
实时内容管理,避免主播违规为平台带来风险,造成不良社会影响。
推荐搭配使用
实时语音转写
语言模型自学习工具
机器翻译

业务电话内容分析
传统中介业务中容易出现客户双方建立联系后抛弃中介的事情,从而导致中介公司经济损失,此类行为往往发生在双方沟通的电话中;所以通过阿里云智能语音交互将实时通话录音转为文本,实现客服语音实时监控、语音离线质检,及时定位问题、预警业务风险。
能够解决
通过阿里云语音识别服务,可以帮助中介及时的发现上述问题;
从而阻止逃单行为,避免经济损失。
推荐搭配使用
实时语音转写
一句话识别

智能语音问询终端
公共服务设施(如,地铁售票),需要为残障人士等无法直接操作机器设备的用户提供语音交互,正常享用公共服务。通过智能语音交互能力在用户到达线下消费场所时,进行咨询答疑、业务引导,帮助用户获得更好的消费体验;同时提高了商家的服务效率、为商家节约人工服务成本。
能够解决
在嘈杂的公共环境中,为用户提供多模态语音交互方式;
给用户带来舒适体验的同时提高了商家的服务效率、为商家节约人工服务成本。
推荐搭配使用
一句话识别
设备端SDK

小说新闻内容阅读
借助阿里云语音合成等能力,将小说新闻等长篇文字形式的信息,根据不同场景和用户习惯需要转化成音频形式的播报的形式
能够解决
地铁、开车、散步、吃饭等生活场景下,可以将需要阅读的内容转化为贴近场景的声音,解放“低头族”。
推荐搭配使用
语音合成

互联网娱乐解决方案
移动互联网下沉及用户年龄段拉大,需要丰富的交互形式满足不同特征用户的使用需求。
能够解决
驱动互联网娱乐领域的业务创新,帮助客户在激烈的竞争环境中获取优势。
推荐搭配使用
一句话识别