智能语音交互解决方案

发布日期:2017-02-23 22:25:33

智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有应用案例。

语音识别,提供的是将语音转写成文字的服务,在金融、保险、司法、电商等领域中,在客服通话、演讲、法庭庭审等场景下,阿里云的该项技术,均有过较好的运用。该项技术包括以下三种类型服务:

实时语音识别

该项服务能对音频流做实时转写,达到“边说边出文字”的效果。可用于视频实时直播字幕、实时会议记录、法庭庭审记录等场景

    录音文件识别

    该项服务能对整个录音文件进行语音转写。可用于对实时性要求不高的客服通话转写,也可用于会议或访谈录音的离线转写。

       

      一句话识别

      该项服务能对时长较短的语音进行转写。主要用于一句话的交互模式,如语音搜索、语音指令、语音短消息等场景,一般应用于各类App中