6月12日下午,国内AI公司科大讯飞在京召开讯飞输入法媒体见面会,同时正式启动“AI方言说话人招募”公益行动。今天,人工智能渗透并日益改变着我们的生活。科大讯飞在核心技术上不断投入大量研发力量,研究成果落地快。讯飞输入法负责人翟继波也全面介绍了新讯飞输入法的功能和语音输入的技术特点。
语音识别率从97%提高到98%
回归本质,输入法不仅是人机交流的媒介,也是人际交往的重要工具。纵观输入法的发展历史,输入法经历了从吴彼、手写、拼音到拼音输入的数次变革。语音作为最自然、最方便的输入法,深刻改变了用户的输入习惯,繁荣了互联网应用。2016年10月,在锤子科技新产品发布会上,罗永浩以极快的速度随口说了一段话,讯飞输入法瞬间“打出”了文字,识别结果是逐字逐句。
早在讯飞输入法诞生的时候就确定了语音为核心,是世界上第一个支持智能语音输入功能的。在过去的一年里,讯飞输入法在输入效率和智能方面取得了很大的进步,不仅一分钟可以识别400个单词,还支持多语言实时语音翻译、超长语音输入、耳语输入、方言语音输入等功能。值得一提的是,科大讯飞在感知智能、认知智能和两种智能深度结合领域取得了国际领先的研究成果,这些AI黑技术正在应用于讯飞输入法,率先实现了行业98%的通用语音识别率。
到目前为止,智能语音极大地扩展了人类输入的速度,不仅带来了更方便的输入体验,也带来了交互模式的惊人变化。面向未来,输入法将不再局限于五笔九格26键手写固定键盘。讯飞输入法率先推出“Mod键盘”、“语音键盘”、“VG语音交互面板”等创新人机交互,“重新定义键盘”让输入更有趣味性。
人工智能正在从感性智能向认知智能跨越,科大讯飞对人工智能应用的设想正在从“听和说”向“理解和思考”转变。在科大讯飞看来,手机的输入方式发生了巨大的变化,语音输入已经达到了实用的门槛,语音交互的比例也在不断增加。随着对涟漪效应的理解,讯飞输入法成为了一款高粘性的工具产品。在媒体见面会上,讯飞输入法市场负责人李强军介绍,讯飞输入法用户规模突破6亿,月语音输入覆盖率达到50%,语音普及率逐年保持增长。
新版讯飞输入法增加了多种功能,1分钟可输入400字
新的讯飞输入法有几个特点:
首先,新的输入法支持多种场景,如安静环境下的耳语识别和嘈杂环境下的智能降噪。
其次,讯飞输入法还支持23种方言输入,方言识别准确率在80%以上,还支持中英文语音混合输入。
第三,新输入法还改进了一些输入细节,比如支持个性化词汇。用户通过登录讯飞输入法账号,可以为每个人存储个性化姓名、专业名词、地名,从而实现个性化输入。同时支持同音字的智能判别,机器可以根据上下文智能判断同音字,比如“他”“她”“他”。还可以支持语音修饰词的智能标点添加。
添加面对面翻译和光学字符识别摄影
此外,翟继波重点介绍了新讯飞输入法的几个功能。添加面对面翻译,支持中、英、日、韩、俄即时翻译。不仅如此,还充分考虑了使用场景,将面对面交互引入到语音翻译应用中。比如双方都说母语时,对方会同步看到翻译结果;尤其是语音播报功能的加入,面授翻译有了自己的“嘴”,身边还有翻译,增强了翻译的实用性。
一般从文档和图片中提取文字需要手工录入大量文字,效率不高,可能会导致错别字。讯飞输入法基于用户需求,增加了OCR摄像头输入,相当于给输入法装了一双“眼睛”。这个新功能的意图是可以轻松识别和提取书籍、街道标志、名片等纸质图片中的字符,方便用户编辑、分类和管理,节省大量输入时间。更让人惊讶的是,内置的OCR不仅可以识别各种打印,而且识别手写的准确率高达90%以上,即使字体潦草。作为高效输入的补充,OCR照片输入可以在输入过程中捕捉多个场景中的字符,满足用户的多样化需求,帮助讯飞输入法成为未来最智能的输入法。
未来讯飞输入法将继续结合AI,不断提升语音识别、语义理解、机器翻译、图像识别、语音合成等技术能力,赋予输入法更多的想象力空。
交流会上,科大讯飞资深多语种研究员还介绍了讯飞的方言保护计划,该计划由科大讯飞发起,并与相关部门合作,利用人工智能技术保护方言。除了使用统一的文本分析框架,还可以使用AI技术复制方言,比如藏语、满语、上海话。会上,科大讯飞还发布了招募方言人士的“方言保护”应用程序。
1.《讥飞输入法 讯飞输入法推新版:1分钟输入400字,新增OCR拍照输入》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《讥飞输入法 讯飞输入法推新版:1分钟输入400字,新增OCR拍照输入》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guonei/1002617.html