文/顾晓波
“外国的Siri都没戏了,还中国的Siri呢。”在去年一场语音技术大会上,一位业内大佬私下对记者说,说完后就开始上台鼓吹语音助手的未来。
在业界大佬和投资人们的吹捧下,语音应用的大饼被越画越大,2012年随着Siri支持中文,又一波创业者投身其中,各家迫不及待地通过各种演示来证明自己可以秒杀Siri。
然而两年过去了,在很多智能语音应用上,被放在第一位的功能仍然是“打电话给张三”、“发短信给李四”等,讽刺的是语音拨号在2000年推出的诺基亚3310上就已经被支持,除了语音识别率的数字不断升高,语音助手却并没有实质性的进步。
“这是一场持久战。”科大讯飞移动互联事业部副总经理章继东说,“未来语音应用一定会成为刚需,但是产品形态比起现在肯定会有很大的改变。”
所有语音助手总用户量仅5000万
易观智库今年5月发布的数据显示,2013年5月语音助手类应用累积下载量排行中,冲动语音助手以29.8%占比第一,其次是智能360占25.2%,而科大讯飞旗下的讯飞语点由于灵犀的分流,排名第三,占到20.1%。
虫洞语音助手创始团队成员王向一透露,目前虫洞语音助手总用户为1600万,月活跃用户在百万左右,按照易观智库的比例计算,国内所有语音助手总每月下载量仅为4442万,用户量总和仅5000万,活跃用户330多万,对目前大多数APP来说,300多万的月活跃都不是一个拿得出手的数字。
想找语音助手的问题太容易,微博、应用商店的评论中,对流量、识别率、理解能力的抱怨比比皆是,尽管语音技术的领头羊科大讯飞已经把语音识别率做到了95%,但是对语音助手而言识别仅仅是开始。
“语音交互的错误会传递,比如语音识别的准确率在85%到95%之间,语义分析的准确率在85%到95%之间,那么最后的准确率就会降到70%-90%。”语音技术提供商思必驰首席科学家、剑桥大学语音识别技术研究院俞凯说。
对多数用户而言,在使用语音助手之前,就已经承担了这10%到30%的出错风险,而这一风险再和结果的准确性叠加,准确达到目的的概率就更低。
不过这并不是语音助手们的错,要通过语音助手完成一个任务,要经过语音识别、语义解析、行动选择、任务处理、语音合成等多个环节,其中语义解析涉及复杂的自然语言处理,任务处理又涉及到搜索和大数据等技术。
目前各家各有所长,百度擅长大数据,讯飞擅长语音识别,虫洞擅长自然语言处理,但是没有一个公司能够将所有环节都做到万无一失,而其中任何一个环节的缺失,都会给语音助手的体验和效率大打折扣。
人工智能理想 vs 人机交互现实
“聪明的让人难以置信”、“全能语音助手”、“比Siri更懂中文”、“深度神经网络”等玄之又玄的描述一再出现在各类语音助手的介绍中,这使得这些软件看上去似乎无所不能,而这也给了用户过高的预期,软件开发商们希望通过夸张的描述吸引用户,却使自己陷入了另一种尴尬——语音助手给了用户一个人工智能的理想,而现实中,它只是一个人机交互工具。
“清晨,手机像仆人一样轻声说:‘主人,该起床了,今天是周五,早上要开例会,别忘了带会议报告哦。’用户随即问:‘今天路况如何?’手机回复:‘今天您的车限行,您可以坐地铁十号线直接到公司,保证不迟到。’”俞凯这样描绘下一代的语音交互技术。
俞凯介绍,思必驰已经通过上下文分析实现了多轮交互,也就是可以识别用户追问的问题,比如用户说“搜索附近酒店”,得到结果后追问“我要三星级的”,语音助手便可在之前的搜索结果之上进行进一步筛选,俞凯表示,语音交互的不确定性可以在多轮交互中有效消除。
而另一家语音技术公司相关负责人表示,这种方式可以针对某些特定场景实现,比如订酒店、查机票等,但是与真正的智能语音仍有距离。
智能360语音助手创始人李传丰表示,如果真的实现,那已经是人工智能,而非简单的人机交互了。
自然语言的解析能力是人机交互与人工智能之间的鸿沟,人类的语言复杂程度超出了机器的理解范围,这给基于语音的任务处理带来了很大的麻烦,记者用讯飞语点测试“附近有什么餐馆”时,系统给出了大众点评的附近餐馆搜索结果,而对系统说“附近有什么便宜的餐馆”、“附近有什么高档餐厅”时,给出的结果与第一次一样。语音软件并不能真正理解用户的需求。
这一问题并不仅仅存在于国内语音助手,俞凯介绍,目前Siri的四个语音技术部门中有一个研究语音的输入输出,四个负责自然语言处理。
“可能大家对语音助手这类产品寄托了太多情感和期望,但这实际上是不合适的。”李传丰说,“人工智能时代很美好,但理性的讲,来的不会太容易,而且并不是单靠语音助手就可以实现。”
而章继东表示,通过上下文解析来提升识别能力并不是不可行,但是这并不是目前的重点,语音助手的搜索结果需要健全的第三方生态去支撑,但是现在无论是用户市场还是第三方生态都不够成熟。
马拉松式竞争 试水穿戴设备与O2O
“我们找了很多投资人,但是他们都说已经不看这一类的项目了。”一位语音助手的创业者说。
资本的驶离让这一场竞争显得更加漫长而残酷,苹果对Siri类软件的排斥则是雪上加霜,讯飞语点和灵犀在经过长达半年的审核,阉割掉诸多功能后才勉强在App Store上架。
章继东表示,这是一场马拉松式的竞争。
事实上有不少“选手”已经中途推出,此前宣称要做中文版Siri的Airi已经将近一年没有更新,小i机器人转向B2B市场,搜狗语音助手在经历了一波大规模推广后逐渐淡去。
幸存者们则在技术和市场的漫长煎熬中摸索着方向,讯飞语点、虫洞语音助手和智能360都已经通过接入第三方O2O服务进行分成获得一些收入,李传丰表示,目前智能360的重心在酒店、机票、餐饮等领域,未来语音技术肯定会在细分领域爆发。
不过李传丰也坦言,O2O也受到技术的制约,比如订酒店,由于涉及到地名和各种数据,语义解析难度很大。
另一方面智能穿戴设备也给语音助手创造了新的生存空间,章继东表示,智能穿戴设备上的用户需求比智能手机上窄得多,大多集中在打电话、发信息以及输入等功能上,目前的智能语音水平足够满足穿戴设备的需求。
对语音助手类软件而言,价值取决于其能够提供的服务,百度、搜狗等拥有大数据和搜索技术的公司加入补上了这类软件的最后一环,在技术瓶颈难以突破的情况下,加速了这类软件从技术导向互联网服务导向的转型,正如章继东所说,未来语音助手的产品形态肯定不是现在的样子,对正在苦苦煎熬的创业者来说,能撑下去,就有出头之日。
1.《siri中文语音助理 外国的Siri都没戏 中国的Siri们怎么办?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《siri中文语音助理 外国的Siri都没戏 中国的Siri们怎么办?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/478972.html