两者都属于生物特征识别技术,但与流行的人脸识别相比,声纹识别还没有被大众所熟知。声纹识别作为一种低调的身份认证技术,具有其他生物识别技术无法比拟的优势,已经广泛应用于公安和司法系统。声纹鉴定也作为法定鉴定证据,协助破案。
不同声音的唱片
声纹识别是根据说话人发音的生理和行为特征自动识别说话人身份的生物特征识别技术。圣何塞州立大学的国家生物识别评估中心比较了各种生物识别技术。基于同样高的识别准确率,发现由于技术等各种原因,这些生物特征在易用性和应用成本上有很大不同。比如技术成熟的指纹识别,样本采集困难,应用成本增加;虹膜和人脸识别因为技术原因不好用;与其他生物特征相比,声纹识别具有一些特殊的优势:
语音采集自然,声纹提取方便
语音数据可以通过麦克风获得,识别成本低
声纹识别和确认的算法复杂度低
与说语言、方言无关,适合广泛人群
声纹识别的兴起和Siri的诞生
科学家在20世纪30年代开始研究说话人识别。1945年,这项研究有了突破。贝尔实验室的科学家经过多次实验完成了声谱图匹配,提出了“声纹”的概念。1966年,美国法院采用声纹取证,声纹技术开始走上司法实践的舞台。1983年出现了第一个声纹识别国际专利,主要用于电信服务。发明人提出了通过网络改善降噪的技术。
2013年,语音识别公司Nuance开发了一个系统,使用被动声纹识别来验证电话客户的身份,这是苹果Siri技术背后的驱动力。
作为一种语音识别技术,声纹识别的特点是不分析语音内容,只关心说话人的身份。其基本原理是为每个说话人建立一个声纹模型,从语音信号中提取能够反映说话人身份特征的个体特征参数,经过一定处理后按照一定规则在数据库中匹配说话人模型,从而确认或识别说话人身份。其中,实现声纹识别的关键技术包括:
预处理:待识别语音信号后进行预处理,主要去除信号的低频和噪声部分,使信号更容易提取特征。
特征参数提取:声纹识别的核心技术之一,是在语音信号中选择和提取能够反映说话人身份的声学特征的过程。声纹识别中使用的特征参数要求在不同个体之间保持较大差异,但在同一说话人的语音中保持相对稳定。
模式匹配:为每个说话人建立一个声纹模型,将提取的特征参数与声纹数据库中已有的模型进行匹配,根据匹配结果确定说话人的身份。
声纹识别技术面临的挑战
目前,声纹识别技术在市场上应用并不广泛,但并不是技术本身不成熟,而是由于实际商业应用场景的复杂性,很可能导致身份识别出现较大误差。
首先,说话人的语音声学特征不可避免地具有发展性和可变性。即使同一个人,即使采集的两段语音内容相同,在不同时期或特殊情况下,由于情绪、语速、疲劳等原因,声纹特征不一致;
其次,声纹特征提取是在真实环境中进行的,如何去噪去混响仍然是声纹识别中的一大难题。在外部环境中,各种噪声会被录音设备采集,在一定程度上混淆或淹没说话人的信息,使得声纹系统无法获得准确的说话人声纹特征。因此,大多数使用声纹识别技术的产品都适合在相对安静的地方使用。
尽管面临诸多挑战,但声纹识别的优势是显而易见的,在安全、金融等领域已经出现了许多成熟的产品和解决方案。
落地教育领域,声纹识别还可以结合面部表情识别、语音情感识别等技术,对课堂中的语音、情感等非结构化数据进行匹配和可视化,帮助学校进行更加准确全面的教学评价工作,促进个性化教学的创新发展!
1.《声纹识别 可媲美人脸识别的“黑科技”:声纹识别》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《声纹识别 可媲美人脸识别的“黑科技”:声纹识别》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/1683469.html