麦克风阵列,字面意思是指麦克风的排列。也就是说,由一定数量的声学传感器组成的系统用于采样和处理声场的空之间的特性。

早在20世纪70年代和80年代,麦克风阵列就被应用于语音信号处理的研究。20世纪90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为新的研究热点。在“声控时代”,这项技术的重要性尤为突出。

噪音环境呢?

-语音增强

语音增强是指当语音信号受到各种噪声的干扰甚至淹没时,从有噪声的语音信号中提取纯净语音的过程。因此,在嘈杂的环境中,可以准确地识别语音命令。

智能语音的历史

1952年,贝尔实验室制造了一台6英尺的自动数字识别机“奥黛丽”,可以识别数字0 ~ 9的发音,准确率达90%以上。而且对熟人准确率高,对陌生人准确率低。

1956年,普林斯顿大学RCA实验室开发了单音节词识别系统,可以识别特定人的十个单音节词中包含的不同音节。

1959年,麻省理工学院的林肯实验室为十个元音开发了一个与说话者无关的语音识别系统。

在1964年的世博会上,IBM向世界展示了数字语音识别的“鞋盒识别器”。

1971年,Darpa赞助了一项为期五年的语音理解研究项目,希望将识别的单词数量增加到1000多个。参与该项目的公司和学术机构包括IBM、卡耐基梅隆大学和斯坦福研究所。就这样,哈佩出生在CMU。与以前的识别器不同,哈佩可以识别整个句子。

1984年,IBM发布的语音识别系统在5000词汇水平上实现了95%的识别率。

at & T:贝尔实验室建成首个智能麦克风系统,用于研究大房间空声源定位跟踪问题。

自1987年国家开始实施963计划以来,国家863智能计算机学科专家组每两年建立一个语音识别研究项目。

1987年12月,李开复开发了世界上第一个“与说话人无关的连续语音识别系统”。

1988年,卡耐基梅隆大学利用VQ/隐马尔可夫模型方法开发了世界上第一个独立的大词汇量连续语音识别系统SPHINX,该系统可以识别包括997个单词在内的4200个连续句子。同年,清华大学和中科院声学研究所在大词库中文听写机的开发上取得突破。

1992年,IBM推出了第一个听写系统,名为“IBM语音服务器系列”。

1992年开发的Sphinx-II在美国国防高级研究计划局资助的语音基准评估中取得了最高的识别准确率,这主要是由于它在高斯混合和马尔可夫状态水平上用栓接参数平衡了可训练性和效率。

1.《语音麦克风 智能语音技术中的麦克风阵列是什么?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《语音麦克风 智能语音技术中的麦克风阵列是什么?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/1756735.html