图片来源:罗海创意

随着智能音箱的普及和背后语音交互生态的成熟,将会有越来越多的设备发声和智能化,语音将真正成为人机交互的接口。在语音交互设备中,语音芯片因其定制化、低功耗、高能效、智能化和成本优势变得越来越重要,成为人与云之间的桥梁。

在智能语音市场,在亚马逊、谷歌等互联网巨头的推动下,仅智能音箱今年全球销量就有望达到3000万台,在各个国家层出不穷,市场处于爆炸性状态。联发科作为语音芯片市场的最大玩家,占有70%的市场份额,2017年语音芯片出货量有望达到2000多万。

据调查发现,随着语音交互的出现,一个新的语音芯片行业诞生了,数十家公司参与其中。语音芯片的发展呈现出前期通用组合芯片的趋势——语音芯片出现——语音AI芯片蓄势待发。通过语音芯片发展的三个阶段和几十家芯片公司的引进,智能东西向你展示了语音芯片的崛起!

注以上是智力和事物的不完全统计

总结:语音芯片发展的三个阶段

本文所描述的语音芯片是针对智能语音设备兴起后的语音交互场景而专门构建的SoC芯片。它兼具计算能力和低功耗,支持多通道麦克风阵列接口和信号处理算法。

在人机对话的语音交互中,语音识别、语义理解、语音合成、任务执行等都是在云中进行的。在终端端,语音芯片用于将智能语音设备拾取的多通道声音进行处理并传输到云端,并将反馈结果以语音的形式输出。如果说云是智能语音设备的大脑,那么语音芯片就是连接人和“云大脑”的桥梁。

目前,智能扬声器的快速发展正成为语音芯片崛起的重要推动力。据产业链各方消息,志东预测,智能音箱的市场规模有望在今年年底达到3000万台。这意味着只有智能音箱的发展,才会推动语音芯片市场达到3000万数量级。虽然无法与拥有数十亿计算单元的手机芯片相比,但作为一个新的品类,它仍处于快速发展期。

在智能音箱市场,联发科、德州仪器、柯胜勋、全志科技、杭国鑫、陈静科技、成都戚颖泰伦等芯片厂商都推出了相关语音芯片,只有联发科一家,占据了智能音箱约70%的市场份额。粗略计算,2017年联发科语音芯片销量将超过2000万。

通过观察目前市场上的语音芯片,我们发现语音芯片具有以下特点:一是兼具计算能力和低功耗,采用最合适的CPU进行语音处理;二是具有高度集成的语音SoC,支持多通道麦克风阵列接口,集成了编解码器模块/DSP模块,集成了WiFi/蓝牙模块等。三是支持语音算法中的回声消除、噪声抑制、声源定位、语音增强等技术,或者具有良好的音值调整功能;它的四个终端是智能的,集成的神经网络单元定位在云中训练的部分智能。

根据语音交互的发展,语音芯片的发展可以概括为三个阶段。第一阶段是语音芯片的过渡期,采用通用的芯片组合方案,第二阶段是上升期,语音芯片上升;第三阶段是语音芯片的进化,语音AI芯片应运而生。

在第一阶段,虽然智能语音设备,包括智能扬声器和远场交互式智能电视,在2015年左右之前已经出现,但在没有市场容量的情况下,语音设备大多使用通用芯片+编解码器芯片/数字信号处理器芯片的组合来实现语音处理,如全志的R16芯片。

2015年至2017年间,随着智能语音设备市场规模的进一步发展,专门用于智能家居或智能音箱的语音芯片开始陆续出现,包括联发科推出的MT8516芯片、科盛讯的CX20924/CX20921、安逻辑的A113、瑞信威的RK3036/RK3229等。

此外,随着智能语音设备的快速发展,对终端智能的需求也在不断涌现,语音AI芯片应运而生。端智能是近两年AI领域的概念之一,是指在前端设备上进行数据采集、计算和决策,具有稳定、延时小、保护用户隐私等优点。比如杭州国鑫推出的GX8010,戚颖泰伦推出的CI1006都是语音AI芯片。

前期:一般芯片组合搭配

在智能语音设备市场的前期,由于芯片研发周期长,研发投入高,在市场规模不大的情况下,市场上没有专门应用于智能语音设备的语音芯片。

2010年6月,微软推出Kinect体感外设,2012年,三星推出远程语音电视,2014年秋,亚马逊推出智能音箱Echo,2015年,&:由推出的叮咚音箱就是智能语音设备的早期代表。他们大多采用通用芯片的组合。)+编解码器芯片/DSP芯片等。编解码芯片捕获模拟信号的数字信号,DSP部分处理数字信号,包括回声消除、噪声抑制、语音降噪/增强等。,便于后端语音识别,然后由通用芯片处理并发送到云端提供语音处理计算

以亚马逊Echo为例。2014年秋天,亚马逊推出了智能音箱Echo,最初使用的是TI的DM3725数字媒体处理器。该芯片主要用于多媒体设备、视频机顶盒、游戏终端等。在处理语音传输时,仍然需要与编解码器芯片相匹配。早期的Ehco,亚马逊用的是TI的DM3725加上TI的ADC。

德州仪器DM3725芯片

后来可能是出于成本等考虑,亚马逊的一些产品开始使用联发科的MT8563芯片,这也不是语音专用芯片。直到今年的Q2,联发科推出了被认为是真正的语音芯片的MT8516。

另一个例子是丁咚演说家,中国早期聪明演说家的代表。最初国内没有专门的语音芯片,采用全志科技R16芯片+科盛讯编解码芯片的方式进行语音处理,而在全志R16之前是平板用芯片。

语音交互早期,智能设备销量不多。即使我们看到了这种潜在的机会,开发一种特殊芯片的时间成本和投资成本决定了在最初的一段时间内,智能设备需要使用通用芯片或其他芯片作为过渡期。

中小型语音芯片制造商已经出现

随着智能语音设备销量的不断增长,通常从2016年开始,以亚马逊Echo为代表的智能音箱市场规模不断扩大,专用语音芯片也开始出现。2016年正是语音芯片崛起最集中的一年。

事实上,早在2013年7月,中国就诞生了第一款专用语音芯片,由四川长虹和中国科学院声学研究所付强共同研发。新开发的长虹语音芯片的优点是结合了基于语音识别的各种语音增强功能,包括语音降噪、回声消除、波束形成等。,支持低功耗唤醒,可实现远场语音采集。可能是因为四川长虹的一些原因,这款芯片开发出来后没有投入生产,后来就不了了之了。

2015年后,语音芯片开始陆续崛起,包括联发科MT8516、科盛讯CX20924、陈静半导体A113、瑞信威RK3036、北京郑钧X1000等公司。比如联发科向阿里天猫精灵推出了MT8516,向小米AI音箱推出了陈静A113。

阿里天猫精灵主控板上使用的联发科MT8516芯片

总体来说,这些语音芯片是智能音箱和智能家居场景的专用芯片,支持多通道麦克风阵列接口,采用CPU适合语音处理;语音算法中支持回声消除、噪声抑制、声源定位、语音增强等技术,兼顾计算能力和低功耗。

但有趣的是,除了联发科,一些中小芯片公司也推出了语音芯片,而高通、英特尔等巨型芯片公司却没有推出语音芯片。考虑到联发科过去是以DVD光驱起家,多媒体一直是其核心技术,跟进语音芯片也就不足为奇了。高通和英特尔没有跟进语音芯片。一方面反映出相对于手机和电脑,语音芯片市场目前规模较小,没有引起巨头玩家的关注;另一方面也反映出他们在语音芯片的布局上进展缓慢。比如高通今年6月发布的智能语音平台,一方面弥补了语音芯片发展缓慢的不足。

此外,Zhidx还获悉,全志科技将于2018年初推出专用语音芯片,联发科将于明年推出更具竞争力的语音芯片。

语音AI芯片准备好了

随着华为麒麟970芯片和苹果A11芯片的推出,AI芯片成为业界热门话题。所谓AI芯片也叫AI加速器或计算卡,是人工智能应用中专门用来处理大量计算任务的模块,从而实现端智能。

目前无论是智能音箱还是其他智能设备,更多的智能都是在云中实现的,但是在云中语音交互存在“时间延迟”的问题,限制了设备的使用空以及由此产生的数据和隐私危机。为了使设备的使用场景不受限制,用户体验更好,端端智能已经成为一种趋势,语音AI芯片也随之而来。

从2016年开始,语音AI芯片开始进入大家的视野。成都戚颖泰伦去年推出CI1006,杭州国鑫今年10月底推出GX8010,都是语音AI芯片。

杭州国鑫GX8010芯片

与语音芯片相比,语音AI芯片具有以下特点:一是语音AI芯片集成专用AI处理器模块,加速本地机器学习算法;二是集成度高。语音AI芯片不仅集成了CPU和AI处理器,还集成了DSP信号处理、WiFi/蓝牙等模块;三是可以实现端侧智能,将一些常见或简单的功能直接集成到本地,通过AI芯片进行本地计算,让设备在端侧离线完成听歌、日常问答、聊天等任务,实现更快的交互能力。

考虑到用户体验和数据隐私的问题,更快的交互体验和更多的本地计算将是一种趋势。随着智能语音场景的爆发,语音AI芯片也将迅速发展。

而现在的AI芯片更多的是在手机和视觉应用领域。一方面手机市场足够庞大,另一方面视觉应用技术相对成熟。在语音领域,一方面语义理解技术在短时间内难以突破,另一方面智能语音是一个新兴市场。智能音箱作为典型的爆款产品,今年全球市场规模仅在2500万至3000万台之间,导致语音AI芯片进展相对缓慢。

联发科副总经理、家庭娱乐产品事业部总经理尤仁杰曾提出智能语音发展的三阶段观。他认为,智能语音的第一阶段是智能音箱的普及,第二阶段是更多智能语音设备的出现,语音成为人机交互的界面。第三阶段是端侧智能,通过语音AI芯片实现更多的本地计算,为用户提供更好的交互体验。

不难看出,我们还处于第一阶段,需要推动智能音箱的普及和更多智能设备的出现,从而推动语音交互界面的到来。只有语音成为交互界面,才意味着整个智能语音市场的爆发,更多的巨型芯片厂商和中小型芯片厂商会涌入其中。

鉴于智能语音设备所要求的智能性,来访者杰表示,CPU本身可以做一些“轻”的AI功能。如果本地需要很强的AI能力,目前会通过基于语音芯片的外置AI处理器来实现。此外,游杰还透露,联发科推出语音AI芯片需要1~2年时间。

相对于新型芯片研发成本高,在对计算能力需求大的产品上增加独立的AI处理器模块,确实可以满足产品端AI能力的需求,缓解芯片产品研发周期长的问题。从时间上看,随着智能语音的兴起,未来1~2年可能是语音芯片爆炸的高峰期。

语音芯片驱动新兴产业

有分析师认为,到2020年,AI芯片市场将达到146.16亿美元,占全球人工智能市场的12.18%。随着人工智能的普及,以GPU、FPGA、ASIC为代表的AI芯片将会迅速发展,语音芯片/语音AI芯片也将在这个过程中受益并爆发,一个新的语音芯片行业和一波语音芯片公司将在这个过程中诞生。

根据游客智能语音发展的三阶段理论,目前我们还处于智能音箱普及的第一阶段。一是通过一个爆炸性的产品引爆整个语音交互行业,从而推动家庭场景和办公场景的智能语音,让语音成为人机交互的接口,真正推动语音芯片的爆发,向语音AI芯片进化。

仅今年,全球智能扬声器市场的销量预计就将达到3000万台。随着语音交互的进一步爆发和场景的进一步发展,智能语音设备将迅速进入十亿级市场。可见,无论是现在的语音芯片,还是即将推出的语音AI芯片,都将有着广阔的市场空。

因为目前的智能语音市场比较小,高通、英伟达、英特尔等芯片巨头对这个市场都不看好或者语音芯片发展缓慢,给了中小芯片厂商更多的发展机会。

目前,语音芯片行业已经出现了数十家公司在该领域“拓展地盘”,包括联发科、杭州国鑫、全志科技、陈静半导体、戚颖泰伦等。,包括芯片领域的大公司,面向智能家居和消费电子的国有芯片品牌,以及新兴的创业公司。正是语音交互的兴起,给他们提供了除了现有业务之外的新的经济增长点,随着语音交互的爆发,下一个巨型芯片公司甚至会诞生在这个领域。

可以预见,2018年将诞生更多的语音芯片,未来1-2年,语音AI芯片将进一步发展,迎来一个爆发期。

结论:语音芯片的兴起

随着语音交互设备的诞生和发展,芯片也经历了从通用组合芯片到语音芯片再到语音AI芯片的演变。随着语音交互的爆发,语音真正成为人机交互的界面,语音芯片也会爆炸。

然而与此同时,声音和视觉将会融合。毕竟多元化的互动方式更符合人的体验。语音芯片兴起后,“语音+屏幕”的交互模式也是业界公认的趋势。

1.《语音ic 语音芯片崛起:背后有千万销量百亿市场》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《语音ic 语音芯片崛起:背后有千万销量百亿市场》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1668725.html