当前位置:首页 > 科技数码

讯飞语音输入 语音识别技术原理是什么 讯飞语音识别技术特点介绍【详解】

  语音识别技术原理简介

  自动语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。

  语音识别技术所面临的问题是非常艰巨和困难的。尽管早在二十世纪五十年代,世界各国就开始了对这项技术孜孜不倦的研究,特别是最近二十年,国内外非常多的研究机构和企业都加入到语音识别技术的研究领域,投入了极大的努力,也取得了丰硕的成果,但是直到今天,距离该技术得到完美解决还存在着巨大的差距,不过这并不妨碍不断进步的语音识别系统在许多相对受限的场合下获得成功的应用。

  如今,语音识别技术已经发展成为涉及声学、语言学、数字信号处理、统计模式识别等多学科技术的一项综合性技术。基于语音识别技术研发的现代语音识别系统在很多场景下获得了成功的应用,不同任务条件下所采用的技术又会有所不同。下图是在一个相对通用的任务条件下的语音识别系统示意图。语音识别系统构建过程整体上包括两大部分:训练和识别。训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”;而识别过程通常是在线完成的,对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块:“前端”模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等;“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别(又称“解码”),得到其包含的文字信息,此外,后端模块还存在一个“自适应”的反馈模块,可以对用户的语音进行自学习,从而对“声学模型”和“语音模型”进行必要的“校正”,进一步提高识别的准确率。

  语音识别技术发展历史及现状

  语音识别的研究工作大约开始于20世纪50年代,当时AT&T Bell实验室基于共振峰提取技术实现了第一个可识别十个英文数字的语音识别系统——Audry系统。

  60年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态时间规划(DP)和线性预测分析技术(LPC),其中后者较好地解决了语音信号产生模型的问题,对语音识别的发展产生了深远影响。

  70年代,语音识别领域取得了较大进展。在理论上,LP技术得到进一步发展,动态时间归正技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。

  80年代,MFCC的参数提取技术和HMM模型的深入使用使得语音识别技术得到进一步的发展,语音识别的问题逐步在理论体系上得到了比较完整和准确的描述,同时在实践上又逐步研发出效率较高的解决算法。

  90年代以来,在美国国防部的Darpa测试、Ears计划、近期的Gales计划,以及我国863计划等推动下,一大批高水平的研究机构和企业加入到语音识别的研究领域,极大地推动了语音识别技术的发展和应用。语音识别系统已经从过去的小词汇量、孤立词识别、特定人识别、安静环境等简单任务逐步发展到大词汇量、连续语音、非特定人、噪声环境下的识别任务,从单纯的语音识别任务发展到语音翻译任务,从实验室系统走向商用系统。

  讯飞语音识别技术

  讯飞语音识别技术的理念是提供信息时代人机沟通的最佳方式。在核心技术研究方面,科大讯飞公司一直秉承着“顶天立地”的方针。“顶天”,就是要求在基础技术上不断创新,不断突破;“立地”,就是技术要和实际应用相结合,最终能够产生经济效益和社会效益。讯飞语音识别技术的研究继承了这样的优良传统,在基础技术方面锐意进取,不断创新,特别是在特征鲁棒性、模型区分性训练、大词汇量语音识别解码技术、语音模糊搜索等方面提出了多项创新性观点,并多次在国内外著名的学术期刊、会议及专刊上进行发表,取得了丰硕的成果。在技术与实际应用相结合方面,也充分考虑了应用系统之间的差异,为客户量身定制,提供了语音命令识别、智能语音搜索、语音检索等技术,并正在开展针对自然连续语流的会议内容转写识别整套解决方案。

  下面是科大讯飞对语音识别技术的整体规划:

  命令词识别技术—在受限的命令词或者语法范围提供自动语音识别服务,需要很少的计算资源,但是要求用户能够“配合”语音识别系统,尽量说“集内词”。

  智能的人机交互技术—结合大词汇量语音识别、自然语言理解、信息检索等技术提供特定领域内相对开放输入的语音识别服务,对用户的限制较为宽松,在所限定的领域内可以以自然语言的方式进行人机交互。

  语音转写技术—在无特殊限定的范围内完成对连续自然语音进行内容转写,目前还需要较大的计算资源。

  语音搜索技术—语音技术和搜索技术的结合,提供最便捷的信息搜索服务。

1.《讯飞语音输入 语音识别技术原理是什么 讯飞语音识别技术特点介绍【详解】》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《讯飞语音输入 语音识别技术原理是什么 讯飞语音识别技术特点介绍【详解】》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/433355.html

上一篇

超光速通讯 量子超光速通信是什么 量子超光速通信优点介绍【图文】

下一篇

入是什么结构 电话网络结构是什么 不同电话网络系统介绍【图文】

和数是什么 数字技术原理是什么 数字技术优势介绍【详解】

和数是什么 数字技术原理是什么 数字技术优势介绍【详解】

数字技术原理术语大全  世界通信与信息技术的迅猛发展将引发整个电视广播产业链的变革,数字电视是这一变革中的关键环节。伴随着电视广播的全面数字化,传统的电视媒体将在技术、功能上逐步与信息、通信领域的其它手段相互融合,从而形成全新的、庞大的数字电视产业。这一新兴产业已经引起广泛的关注,各发达国家根据自己的国情,已分别制定出由模拟电视向数字电视过渡的方...

手机语音信箱 手机语音信箱如何使用 手机语音信箱功能介绍【详解】

手机语音信箱 手机语音信箱如何使用 手机语音信箱功能介绍【详解】

手机语音信箱如何使用  语音信箱  当您工作繁忙、手机关机、手机超出网络覆盖范围或电池没电而无法接听来电时,您可通过手机键盘操作设置语音信箱转移功能,语音信箱将随时替您收录来话,使您不会错过任何电话,同时可使您回避某些电话,减少打扰。当您的手机处于可接通状态,短消息中心会即时通知您收听已记录的留言。  语音信箱———来电一个也不丢  语音信箱是移...

什么叫纳米技术 纳米技术是什么 纳米技术在通信中的应用介绍【图文】

什么叫纳米技术 纳米技术是什么 纳米技术在通信中的应用介绍【图文】

纳米技术在通信中的应用  纳米科技中的“纳米”为10-9 m,用符号表示为nm,是lmm的100万分之一。原子的直径为0.1-0.3nm。研究小于10-l0m以下的原子内部结构属于原子核物理、粒子物理的范畴。  纳米科技是指在纳米尺度(1nm到l00nm之间)上研究物质(包括原子、分子的操纵)的特性和相互作用,以及利用这些特性的多学科交叉的科学和...

surround StereoSurround音频是什么 StereoSurround音频技术特点【图文】

surround StereoSurround音频是什么 StereoSurround音频技术特点【图文】

什么是StereoSurround音频技术  StereoSurround音频技术是一种环绕立体声音频压缩编码技术。声音具有很强的表现力,而过去视频、音频组合系统却只重视图像清晰度而忽视声音质量,致使视听融合感差,综合表现能力不能充分发挥。立体声出现后,声系统质量得到了提高,但双声道立体声具有方向感而缺少环境感。因此,在四声道立体声基础上出现的环...

网络可视电话 网络可视电话是什么 网络可视电话技术介绍【详解】

网络可视电话 网络可视电话是什么 网络可视电话技术介绍【详解】

网络可视电话是什么  网络可视电话是一种基于网络传输的,集视频、语音于一体的多媒体通信业务,用户进行语音通话的同时,通过终端的屏幕看到对方的视频图像,同时将自己的本地图像传输到对方。网络可视电话是基于VoIP技术的语音、视频通信软件,与语音交换服务器、电话网关和接点交换服务器构成完整的语音、视频通信平台。  网络可视电话系统主要设备包括:语音交换...

信用卡提额技术 信用卡提额技术一览,信用卡提额有哪些技巧与好处?

信用卡提额技术 信用卡提额技术一览,信用卡提额有哪些技巧与好处?

大家觉得自己现在信用卡的额度够用吗?如果不够用没关系,相信看了本文之后大家就知道怎么帮助自己的信用卡提额了!今天本站就偷偷告诉大家一些信用卡提额技术,相信大家一定会受用匪浅!  信用卡提额技术一览:  1、多刷卡  经常用信用卡,不管多少钱,只要能刷卡,那就使用信用卡支付。  2、多用额度  最好每月账单消费至少占总额的30%。3、临时提额  对...

计算机应用技术专业介绍 计算机应用技术专业介绍 [代码590101]

计算机应用技术专业介绍 计算机应用技术专业介绍 [代码590101]

[导读]:本文讲述了计算机应用技术专业的基本信息及专业介绍,如计算机应用技术专业的课程设置、就业方向、就业前景等,还包括开设计算机应用技术专业的院校名单。计算机应用技术专业基本信息学历层次:专科专业名称:计算机应用技术专业代码:590101所属门类:电子信息所属学科:计算机类培养方向:卫生信息管理、移动应用开发、游戏软件开发、动漫设计与制作、计算...

tcl钛金空调 钛金是什么金 TCL钛金空调技术大揭秘

tcl钛金空调 钛金是什么金 TCL钛金空调技术大揭秘

材质决定性能!材质对空调行业的发展有至关重要的作用,因为空调的功能创新是建立在好材质的基础上。                        材质决定性能!材质对空调行业的发展有至关重要的作用,因为空调的功能创新是建立在好材质的基础上。空调企业往往单凭外表的不断改变和词语的不断更新立于行业之地,不是长久之计。想要在空调行业新的高度上睥睨天下,一套...