当前位置:首页 > 房产信息

谷歌问答 谷歌发布问答系统新语料,同时发布相关挑战赛

据雷锋的《AI技术评论》报道,1月23日,谷歌AI语言研究科学家汤姆·科维亚特科夫斯基和迈克尔·科林斯在谷歌AI Blog上发表博文,宣布发布新的语料库《自然问题》(NQ),用于大规模训练和评估开放领域问答系统,旨在推动人们开发出更有效、更强大的问答系统。

开放领域问答是自然语言理解(NLU)中的一项基准任务,旨在模拟人们如何通过阅读和理解整个文档来寻找信息和问题的答案。给出一个用自然语言表达的问题(“天空为什么是蓝色的?一个问答系统应该能够阅读网页(比如这个维基百科页面)并返回正确答案,即使答案有点复杂冗长。但目前还没有大量公开的自然生成问题(如人们在寻求信息时提出的问题)及其答案,可以用来训练和评价问答模型。这是因为收集一个高质量的回答问题的数据集不仅需要大量真实的问题源,还需要大量的人力来找到正确的答案。

为了促进问答系统的研究进展,他们欣然出版了《自然问题(NQ)》,这是一个在开放领域对问答系统进行大规模培训和评估的新语料库,也是第一个复制端到端的过程让人们寻找问题的答案。NQ很大,由30万个自然出现的问题和维基百科页面上手工标注的答案组成,可以用来训练问答系统。它们还包括16,000个由五个不同标注器标注答案的例子,这有助于评估经过训练的问答系统的性能。电脑很容易回答琐碎的事情。因为在NQ回答问题需要比回答琐事更深刻的理解问题,基于这些数据,他们还组织了一场比赛,以帮助促进计算机自然语言理解的研究进展。雷锋。com

数据

NQ是一个数据集,它首先使用自然出现的查询,它专注于通过阅读整个页面来寻找答案,而不是从简短的段落中提取答案。为了创造NQ,他们从用户对谷歌搜索引擎的真实、匿名和聚合查询开始。然后,他们让播音员通过阅读整个维基百科页面来找到答案,就像他们自己提出了这个问题一样。注释者寻找包含推断答案所需的所有信息的长答案,以及用一个或多个单词简洁地回答问题的短答案。NQ语料库的标注准确率高达90%。

NQ的目标是使问答系统能够阅读和推理整个维基百科文章,其中可能包含也可能不包含问题的答案。首先,系统需要确定问题是否定义明确,是否可以回答——很多问题包含错误的假设,或者描述过于模糊,无法简洁地回答。然后,他们需要确定维基百科页面的任何部分是否包含推导答案所需的所有信息。他们认为,识别长答案的任务——找到推断答案所需的所有信息——比在知道长答案后找到短答案需要更深层次的语言理解。

他们的论文《自然问题:问答研究的基准》已经发表在《计算语言学协会杂志》上,对数据收集过程进行了全面的描述。要查看数据集的更多示例,请访问NQ网站。

挑战

自然题有7842个例子的盲测集,格式和公布的开发集一模一样。在此页面上创建一个概要文件,以便在测试集上运行模型并查看它们的性能。为了保持测试集的完整性,每个团队只允许每周提交一次。您可以在他们提供的200个示例devsets上运行测试。这个次数没有限制。

要提交模型,您应该创建一个Docker映像,并根据NQ Github页面上的说明将其上传到谷歌云存储。

上传图片后,请登录此页面显示提交表单。选择要在NQ排行榜上显示的车型名称和要在个人主页上显示的标签。

他们希望NQ和相关挑战的发布将有助于促进更有效和更强大的质量保证系统的发展。他们鼓励NLU社区参与,并帮助缩小当前最先进的方法和人类上限之间的巨大差距。请访问挑战赛网站查看排行榜并了解更多信息。

via:https://ai . googleblog . com/2019/01/natural-questions-new-corps-and . html

雷锋。com

1.《谷歌问答 谷歌发布问答系统新语料,同时发布相关挑战赛》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《谷歌问答 谷歌发布问答系统新语料,同时发布相关挑战赛》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/1407038.html

上一篇

萨姆吉尔 石器时代 石器EE「特色任务」强化老虎(活动任务)

下一篇

韩国夜店集体感染病例增至94例 究竟是怎么回事?

mac系统自带转格式 苹果手机照片传到Mac电脑修改格式成jpg或png,不需要任何工具

  • mac系统自带转格式 苹果手机照片传到Mac电脑修改格式成jpg或png,不需要任何工具
  • mac系统自带转格式 苹果手机照片传到Mac电脑修改格式成jpg或png,不需要任何工具
  • mac系统自带转格式 苹果手机照片传到Mac电脑修改格式成jpg或png,不需要任何工具

地平线零之曙光 《地平线 零之曙光》系统介绍

  • 地平线零之曙光 《地平线 零之曙光》系统介绍
  • 地平线零之曙光 《地平线 零之曙光》系统介绍
  • 地平线零之曙光 《地平线 零之曙光》系统介绍
广宗饮用水异常问题调查结果公布 究竟是怎么回事?

广宗饮用水异常问题调查结果公布 究竟是怎么回事?

河北广宗县人民政府发布了关于部分村庄饮用水异常问题初步调查结果的通告。经调查,广宗县部分村饮用水异常事件已初步查明原因,系广宗县志通电动自行车厂于4月23日晚,利用自来水向酸洗槽注水过程中,现场操作技术员未按照操作规范关闭注水管,当晚23:00供水站停水后,由于倒虹吸效应,导致酸液倒流入供...

巴特尔放倒奥尼尔 奥尼尔永远的痛,曾被巴特尔单手掀翻,答案不可思议!

  • 巴特尔放倒奥尼尔 奥尼尔永远的痛,曾被巴特尔单手掀翻,答案不可思议!
  • 巴特尔放倒奥尼尔 奥尼尔永远的痛,曾被巴特尔单手掀翻,答案不可思议!
  • 巴特尔放倒奥尼尔 奥尼尔永远的痛,曾被巴特尔单手掀翻,答案不可思议!

梅溪湖女孩 原创 《声入人心》的热度退了吗?蔡程昱和梅溪湖女孩的答案完全相反!

  • 梅溪湖女孩 原创 《声入人心》的热度退了吗?蔡程昱和梅溪湖女孩的答案完全相反!
  • 梅溪湖女孩 原创 《声入人心》的热度退了吗?蔡程昱和梅溪湖女孩的答案完全相反!
  • 梅溪湖女孩 原创 《声入人心》的热度退了吗?蔡程昱和梅溪湖女孩的答案完全相反!

网坛三巨头 网坛三巨头谁最伟大?答案在这里

  • 网坛三巨头 网坛三巨头谁最伟大?答案在这里
  • 网坛三巨头 网坛三巨头谁最伟大?答案在这里
  • 网坛三巨头 网坛三巨头谁最伟大?答案在这里

应急指挥系统 应急指挥系统

  • 应急指挥系统 应急指挥系统
  • 应急指挥系统 应急指挥系统
  • 应急指挥系统 应急指挥系统
筑云电子商务系统 筑云分享:平台型电商与自营型电商的区别!

筑云电子商务系统 筑云分享:平台型电商与自营型电商的区别!

今天朱云边肖主要分享一些基于平台的电商和自营电商的区别,方便大家选择!  基于平台的电子商务:朱云边肖用简单的话解释,基于平台的电子商务是在网上建一个商城,吸引商家入驻。电商企业以向商家收取一定费用为盈利模式,就像电商企业是线下大商场,商家是专...