高考评分中,作文往往消耗最多的工作量,是最有争议的项目。近年来,高考作文评价体系多次受到质疑,相关领域的专家学者开始利用机器评分来代替准确度低、耗时长的人工评分。11月26日,华东师范大学中文系副教授萨默范在华东师范大学举行的关于“应试作文质量的测量与计算”的研讨会上讨论了机器作文评分的可行性,并对当前应试作文评分进行了反思。

研讨会现场。

通过数据统计,可以找出排除题的作文

据萨默版报道,目前预计将应用于机器分数的自然语言处理模型有三类:规则识别、数据统计和基于神经网络的自然语言处理。

基于规则识别的自然语言处理是指根据一定的规则对作文进行句法分析和语义分析,掌握对语言的理解和表达。萨默范认为这条路对作文机器评分行不通。首先,因为人类本身没有制定正确的作文评分标准。其次,作文评价标准涉及的因素比文章多,思想、逻辑、结构、语言等因素难以规范化。

第二种模型是基于神经网络的自然语言处理。其原理是利用脑科学和仿生学来模仿人脑处理信息的方式。但是从萨默潘的角度来看,这个模型也不适合机器评分。除了训练复杂性高、耗时长外,无法检测和评估信息处理过程,结果的解释下降。

更重要的是,这种模式包括重要的智能伦理问题。Alpha GO的横空出世令人惊讶,比起围棋,作文是人类智力的体现。如果将作文分数交给人工智能,很容易引起伦理上的反感和恐慌。高考是关乎很多人前途的重大考试,如果完全交给人工智能来判断分数,很可能会引起“机器将统治人类社会”的联想。

相比之下,基于数据统计的自然语言处理才是更适合机器评分的模型。这种数据统计的基本原则是句子是否合理,不需要理解其语法含义。只需调查一下人类说的话中出现的可能性有多大。出现的可能性越高,即越合理。可能性越小越不合理。理论上,在进行这种自然语言处理时,人类说的每一句话都要统计一次。但是在现实中进行词频统计已经足够了。词频统计现在是比较成熟的研究成果。“萨默范说:“实际上也可以考虑上下文的关联和影响。”只是考虑的单词越多,计算也就越复杂。”

萨默范指出,数据统计可以有效禁止背作文和作文的行为。现在,中高考成为了背随笔和随笔的重灾区,同样老师教的学生背了同样的范文,所以考试时写出了类似的随笔,这种普遍现象依靠人工力量是很难注意到的。这里就是机器大显身手的地方。通过统计,可以提出重复率百分比,自动总结不同考生写的相同事例,然后手动确认是否作弊。

另外,作文的语言规范也可以使用统计测量。通过计算每篇作文的概率值,概率值越高,语言用法就越一般,从而可以识别出非标准的语言用法。“当然,概率低也有一种可能性。也就是说,作文在语言中使用了创新新颖的表达。这里使用统计法,至少可以选择概率较低的表达,进行人工检查,集中注意力,根据不同类型的作文要求打分。”徐美凡说。

作文能代表国语水平吗?

在对现有技术成果进行机器评分可行性的分析讨论后,萨默范又引入了一个话题。作文真的能衡量考生的语文水平吗?

高中语文老师主要把精力放在总结应付高考作文的技巧上,只教学生如何应付考试,而忽略了实际语文能力的培养。因为只要掌握应试技巧,高考作文就能获得高分。但是这不足以证明语文能力的优秀。另一方面,这证明了今天的高考作文命题和评分机制在衡量考生的语文水平方面存在一定的困难。因此,作文能否反映语文水平,以及如何衡量语文水平,成为了值得深思的话题。

萨默范说,由于作文水平可以被整体认识,很多人认为机器不能胜任,人类也不能公平。但这个问题并非无解。他说,既然现在的作文评价表可以将考生的作文水平分解为语言表达、思想内涵等,为什么不专门为各种能力的评价设计一系列试题呢?让作文摆脱繁琐、模糊的评分体系,改成更明确、更有针对性的试题不是更好吗?(莎士比亚)。

对于这个革命性的提议,现场专家学者不同意。“能写一篇篇幅较长的文章是对考生能力的最大肯定。而且,中国有写长篇文章的传统,不能轻易中断。”在场的一位学者说。关于应试作文的命题评分体系的改革似乎还有很长的路要走。

1.《【高中语文背作文有用吗】机器能批准高考作文吗?至少可以有效地禁止背诵作文和作文》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《【高中语文背作文有用吗】机器能批准高考作文吗?至少可以有效地禁止背诵作文和作文》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/2820417.html