2019年4月8日,第三届搜狐校园内容识别算法大赛正式开始,比赛结果同时向选手开放。搜狐和清华大学计算机系联合发起了这场比赛,目标是全世界的全日制学生。旨在通过提供业务场景、真实数据、专家指导,选拔培养对自然语言处理领域的算法研究和应用探索感兴趣的青年人才,共同探索更多的可能性,开拓无限的未来。
竞赛页面地址:https://biendata.com/competition/sohu2019/
本次比赛的主题是提取文章的主题,判断文章的基调。我们生活在一个信息爆炸的世界里,每天接触到不同的新闻文章,体裁多样,包括新闻快讯、广告软文、深度分析、事件评论、重要人物访谈等等。每天新生成的信息量已经大大超过了读者可以接受的极限。因此,如果有一个机器模型,可以自动提取文章的主题,判断文章对这些主题内容的情感倾向,可以大大提高阅读和消化信息的效率。
具体来说,参赛者需要从给定的文章中提取三个最重要的主题(即实体)。所谓实体,是指人、物、地区、机构、团体、企业、行业等事物。不同于一般的实体抽取比赛任务,这种比赛还要求选手判断文章对主体实体的情感倾向(包括正面、中性和负面情感)。
本次比赛数据来自搜狐智能媒体R&D中心。搜狐智能媒体R&D中心是搜狐的核心用户产品和智能技术R&D部门。依托基于平台和智能的技术能力,该部门在内容领域不断深化,旨在改善用户体验,不断创新,改进现有产品,探索新形式。初赛会发布8万条数据,其中训练集预计有4万条数据,每条数据中的文章都是手工标注的。竞争对手需要利用训练集的数据和标签开发自己的模型,并在测试集上评估自己的模型。
这个比赛是搜狐第三次组织算法比赛。搜狐在2017年和2018年分别举办了两次以“图形匹配”和“软文识别”为主题的算法大赛,在全国范围内引起了巨大反响。两场比赛吸引了国内外1000多支队伍。
本次比赛的总奖金为7.5万元,前10名队伍可以获得证书,每个队伍都有机会通过搜狐招聘面试的直通车。有兴趣参加比赛的选手可登录主办方的数据竞赛平台Biendata.com获取更多相关信息并下载数据集。
进入方法:
竞赛页面地址:https://biendata.com/competition/sohu2019/
友好提醒,由于涉及数据下载,强烈建议您登录PC页面注册。
1.《搜狐校园 第三届搜狐校园算法大赛开赛!》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《搜狐校园 第三届搜狐校园算法大赛开赛!》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/shehui/1273667.html