当前位置:首页 > 科技数码

语音同声翻译 Skype的实时语音翻译如何做到同传的精准?

Skype前几天推出了实时语音翻译的预览版,让用户可以跨越语言的障碍畅快交流。今天我们就来聊聊微软是如何做到这一点的。

Skype的翻译系统主要分三步:首先,把你的实时语音转换成文字;然后,再把文字翻译成另一种语言的文字;最后,把文字转换成语音。其中,识别实时语音并转换成文字一直是最棘手的部分。

图像处理和语音识别是深度学习发展的两个主要方向。近几年来,由于深度学习的进步,语音识别依靠深度神经网络(deep neural networks)也取得了不少进展。神经网络在八十年代就已出现,但真正开始焕发光芒是在2012年,Google让计算机能够“自我修养”——在一堆视频里自主学习并总结出猫的概念。

微软研究员John Platt在接收wired采访时曾表示,微软其实很早之前就开始利用神经网络改善平板电脑的手写识别精确度了。而Skype实时语音翻译系统真正的突破在于识别不同用户间的不同语言不同口音的说话方式。

这一突破发生在2009年的圣诞节,当时微软在英国哥伦比亚赞助了一个小型研讨会,来自多伦多大学的演讲嘉宾Geoff Hinton介绍了自己研究的一种模仿脑神经工作原理的机器学习模型,这一模型依靠多层次的人工神经元,让机器逐渐理解更加复杂的概念。微软听完介绍后,随即砸下一笔巨款,让Hinton的模型可以利用最新的图形处理器单元进行测试。测试的结果很棒,语音识别的精确度提升了25%。

Skype的机器学习原型通过预览阶段的大量数据进行训练,并优化语音识别(SR)和自动化机器翻译(MT)任务,这些优化包括去除语句中的不流利成分(比如“ahs”、“umms”和重复性的语言)、把文本分段成句子、增加标点符号、文本的大小写等等。

其中,语音识别和机器翻译的训练集数据主要有多个来源,包括已翻译的网页、带字幕的视频、翻译转录的一对一对话内容等。此外,很多志愿者向微软贡献出的语音对话也是一个非常重要的训练集数据来源。同时,Skype的翻译系统还会记录用户的对话内容,实现二次利用,以进行数据分析,加以学习。

在数据进入系统之后,机器学习软件会为对话中的单词建立统计模型,当你说到某一个东西时,系统会在统计模型里寻找类似的单词,并响应之前做过的类似的翻译。实时语音翻译对用户对话的环境很敏感,稍有噪音干扰可能准确度就会降低很多。这一方面,深度神经网络有效的减少识别错误率,改善了系统的健壮性,让实时翻译能够有更大的应用范围。

至于不同语言的文本翻译,Skype利用的则是和Bing翻译一样的引擎技术:语法和统计模型的结合使用,同时为特定语言进行特殊的训练。普通的文本翻译往往要求使用规范正确的书面语言,而Skype翻译系统不仅包括Bing翻译的引擎技术,还额外增加了一层口语化的语言业务。

此外,Skype还建立了一套自定义的串连整个流程的架构,以协调系统里多个部分间的运作。如何简单又高效的运作整个系统,也是一门不小的学问。

Skype的实时语音翻译系统还面临着很多挑战,比如语言的变化的速度很快,每个人说话的方式又很独特,这些都会为实时翻译造成不少的麻烦。微软研究院总监Vikram Dendi说,截止到星期一,总共已经有5万个用户注册了预览版Skype翻译,而一天后,这个数字变成了两倍。对于这一种可能会真正改变人们交流方式的科技产品,越来越多的人为之感到激动。

[本文参考以下来源:blogs.skype.com, wired.com]

1.《语音同声翻译 Skype的实时语音翻译如何做到同传的精准?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《语音同声翻译 Skype的实时语音翻译如何做到同传的精准?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/481951.html

上一篇

淘宝被骗 淘宝刷单千人被骗,涉及金额上百万

下一篇

钱颖一 钱颖一:中国的教育扼杀了潜在的杰出人才

思普操作系统 倪光南:国产系统做好应用服务支持才能赶超微软

思普操作系统 倪光南:国产系统做好应用服务支持才能赶超微软

10月28日消息,今日上午,国内操作系统厂商思普企业集团在北京召开了中国操作系统应用推广大会。会上,思普企业负责人对思普桌面系统进行了介绍,另外倪光南等相关专家回答了推进国产操作系统的最新进展。众所周知,除了基础的系统体验,目前制约国产操作系统的最大原因还是应用软件太少。倪光南院士称,目前国内有15家从事操作系统开发的厂商,解决应用生态短板的最好...

微软智能手表 微软预计数周内发布智能手表 续航能力超过2天

微软智能手表 微软预计数周内发布智能手表 续航能力超过2天

图为三星 Gear S本站讯 10月20日消息,据福布斯报道,微软正准备在接下来几周发布一款可穿戴设备。这是一款可以监控佩戴者心率的智能手表,它可以在不同的手机操作系统上运行。据可靠消息称,对于中度用户来说,该手表电池续航能力至少为两天。这已经超越了三星的银河Gear智能手表和Moto 360,两者续航能力只有一天。据悉,微软的这款可穿戴设备预计...

玛丽艾伦马克 微软联合创始人捐款1亿美元抗击埃博拉

玛丽艾伦马克 微软联合创始人捐款1亿美元抗击埃博拉

本站讯 10月24日消息,据美国媒体报道,微软联合创始人之一保罗·艾伦(Paul Allen)周四承诺至少捐款1亿美元抗击埃博拉病毒。这被认为是迄今最大一笔抗击埃博拉和支持西非医疗工作者的私人基金捐款。这笔捐款包括已经捐给美国红十字会等组织的2650万美元,这些钱用于购买设备、招募自愿者和购买教育材料。艾伦在声明中称:“埃博拉病毒与我们以前遇到的...

诺基亚2500 刚裁完诺基亚的12500名员工,微软又开始对自己的5000名员工动手了

诺基亚2500 刚裁完诺基亚的12500名员工,微软又开始对自己的5000名员工动手了

裁员是微软CEO纳德拉的既定方针,今年7月份他就公开了微软要在一年内裁员18000人的计划。这个计划的第一波指向刚刚被收购的诺基亚,13000名裁员计划中有12500人来自芬兰手机巨人。诺基亚中国受到很大影响,一度引发了中国员工的抗议。根据ZDNet的报道,裁员计划的第二波已经启动,1351个裁员名额主要分配给了微软总部Redmond的员工。第一...

幼儿园语言说课稿 幼儿园小班语言说课稿

幼儿园语言说课稿 幼儿园小班语言说课稿

幼儿园小班语言说课稿                  幼儿园小班语言说课稿(一)  各位领导,各位老师,我今天说课的内容是小班语言活动故事《水果屋》。这是我们小班主题活动"多彩的秋天"当中的一个故事。  一、 说教材  (一)、教材分析及处理  故事《水果屋》选自凤凰康选教材小班上册"多彩的秋天"主题教育活动中的一则,是以看图说话为主的故事活动...

lumia730 微软完成收购诺基亚后首秀:Lumia 730/830亮相

lumia730 微软完成收购诺基亚后首秀:Lumia 730/830亮相

Lumia730Lumia830本站讯 9月4日消息,微软于当地时间9月4日上午10点(北京时间下午16点)在德国柏林举办新品发布会,推出Lumia系列新品Lumia 730和Lumia 830系列新机。和传闻相符,Lumia 730/735主打自拍,Lumia 830主打中端高性价比。这也成为微软在4月底宣布完成收购诺基亚后的首次手机新品发布会...

眼镜显示器 微软开发新显示器技术 可让近视者摘掉眼镜

眼镜显示器 微软开发新显示器技术 可让近视者摘掉眼镜

本站讯 7月31日消息,据《福布斯》网站报道,得益于微软、麻省理工和伯克利大学研究人员的研究,不需要戴眼镜看电视的日子即将来临。研究人员开发了新的根据用户视力修正视觉问题和调整图像的显示技术。新技术的工作原理是,利用算法根据用户眼镜度数改变图像,并在显示器前面安装光过滤装置。算法可改变单个像素的光并让光通过过滤器中很小的洞发出,因此当光线到达人的...

快船老板斯特林 法院批准快船交易 前微软CEO鲍尔默成球队新老板

快船老板斯特林 法院批准快船交易 前微软CEO鲍尔默成球队新老板

本站讯 8月13日消息,据国外媒体报道,加州高等法院周二批准洛杉矶快船队的出售交易。前微软CEO史蒂夫·鲍尔默(Steve Ballmer)如今正式成为了快船队的新老板。前快船队老板唐纳德·斯特林(Donald Sterling)因歧视性言论而招致NBA联盟不满,并被强制要求出售旗下球队。其妻谢丽·斯特林(Shelly Sterling)作为斯特...