首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >不止你们可以吐槽高考作文,机器也可以!

不止你们可以吐槽高考作文,机器也可以!

作者头像
达观数据
发布于 2018-03-30 06:29:54
发布于 2018-03-30 06:29:54
8950
举报
文章被收录于专栏:达观数据达观数据

在吐槽满屏的高考季,高考作文成最大槽点。如果我们放下人类的架子,从AI算法的角度来观察,会不会看到什么新奇的结果?小编向达观AI机器君投喂了近几年的高考命题和满分作文,利用文本挖掘技术,带你揭秘高考试卷背后的种种细节。

1

多读书,一定要多读书

拿到今年的高考试题,机器君就算出了热度最高的关键词。去掉了诸如“题目自拟”,“篇幅不限”等通用词以及“的”、“了”等虚词,TOP10如下:

稍加分析,可以发现这些词分为三个大类:我们自身,外部社会以及阅读。“我们”、“我”、“自己”属于第一类,“人”,“纽带”,“他们”,“中国”,“时代”属于第二类,“书”、“阅读”、“书店”属于第三类。

事实上,强调关注自身、关心社会和阅读求知,一直是高考命题的重心所在。我们继续向机器君投喂了过去三年的高考作文题目,得出了Top15如下:

是不是有点似曾相识?除了“书店”以外,今年的热词都是往年的熟面孔。往年的这些高频词,同样可以系统地纳入“我们自身,外部社会以及阅读”这三大范畴。比如“范儿”这一流行词体现的是一种社会现象,“学习”和“阅读”属性相似,“生活”则是我们自身与外部社会结合的结果。

了解了高考命题的侧重点和思路,一篇好的高考作文要素也就呼之欲出:一方面要善于观察和思考自身与社会,另一方面要“腹有诗书”,才能厚积薄发。接下来,我们将向机器君投喂最近5年的满分作文,看看它对写好一篇高考作文,还有哪些其他见解。

2

结构各种多变,脉络始终清晰

一篇好的作文,既要关心人生与社会,传达出富含底蕴的内容,也要打造令人赏心悦目的修辞风格,展现出形式的美感。

所以,高考阅卷老师最偏爱什么样的形式呢?

去年全国卷I的作文题目是看图说话:

有考生们写出这样的题目《致母亲的一封信》……第一眼看到这个题目小编是一脸懵逼的。

不过,用文本摘要算法自动摘取了关键句后,对文章就有了一个清晰的概观:

显而易见,文章的结构是先点题再讲故事,情节先就是两条——“你对我一往情深”+“可是我活得很累”,骨架十分清晰。即使把选取范围缩减到三句,也仍然能体现这些信息:

除了“正-反-合”式的典型辩证法逻辑,完全从反面来立论的“反-正”结构也不在少数,在议论文中尤其多见。

比如2014年全国卷II的主题是“给野生动物喂食,易使它们丧失能力”,满分作文《授之以渔,摆脱依赖》的top5关键句如下:

前面四句都是从反面来论证,“太溺爱必酿恶果”,最后才引出结论——“不如放手”。这种写法“欲扬先抑”,最后点睛,能产生“四辆拨千斤”的结果。

此外,“重叠式”的结构效果也不错。2013年的全国卷1的作文试题围绕“切钻石”,试题的关键句是“不去想价值(方面)的事,手就不会发抖”,当年的优秀作文《钻石有价,我心泰然》就据此展开了论述。对其进行文本摘要处理,抓取关键句如下:

这篇文章采用的结构是用排比的方式,重复突出“唯有……才能……”这一形式的论点,从而让阅卷老师产生深刻的印象。不过这样的论述毕竟有些单薄,这可能也是这篇文章虽然得分不低,但没有摘到满分桂冠的原因。

上述这些作文虽然采用了不同的结构,但是都有一些共同的形式上的特点——每一段的主题都很清晰,全文的脉络也自然连贯。

3

修辞简约受青睐

修辞也是文章形式的重要组成部分。修辞手法一般可以分为“消极修辞”和“积极修辞”两大类。前者强调结构清晰、表达明确、节奏允当,打造的是简约风格,后者则强调使用比喻、排比等手法,能营造出丰繁、绚烂的风格,产生引人入胜的效果。

对于高考作文来说,到底哪种风格更受青睐呢?

首先,机器君对近5年的30篇高考优秀作文进行了“句长方差”分析。 这些文章的句长方差均值为7253,最大值为16224,最小值为1595,差别还是有点明显。 不过一串数据的平均值受极端值影响明显,这串数据的中位数仅为5103,方差超过10000的仅有3篇,可见这串数据呈现某种偏态分布,方差较低的文章在整个优秀作文语料库中占据更多的比重。

从文章风格上说,方差较小说明作者用的长句较少,短句之间搭配也比较平稳,这样会使文章易读、易理解。而方差较大则说明作者在行文中往往长短句交错使用,相对易读性会较差。

除了方差,机器君还对这些文本做了姓名识别。我们概念里总觉得,多引用名人名言能提高文章的“逼格”,提升文章的分数。但从高分作文中的姓名统计来看,事实并非如此。我们利用姓名识别算法识别出近5年的30篇(样本可扩大或不提具体数字)优秀作文中出现的热门人物,发现最热的居然是TA:

排名前五位的都是虚拟人物,其中出现频次最高、也最让人陌生的李明、苏觉是作文《双赢》中的两个虚拟主角;陈先生、小羽和老王是该年试题中的人物。

紧随其后我们看到了熟悉的名字,乔布斯,杨振宁,陶渊明,鲁迅……经过分析,这些人物又可分成两类。乔布斯、杨振宁等属第一类,他们主要作为一个故事案例集中出现在单篇文章中。而陶渊明、鲁迅则属另一类,他们经常在不同的文章中露面,每次仅仅po出一段金句,然后就事了拂衣去,深藏功与名。

从姓名识别的结果我们可以发现,首先,名人名言的引用并非与高分作文有必然联系。如《致陈先生的一封信》、《双赢》等,完全围绕身边的人或虚拟人物来写,根本不提及名人名言,最后仍然得到好评。其次,名人名言的引用多样性很重要。优秀作文中对名人的引用没有集中在少数大家都熟知的人物上,通常是多点开花,涉及多个领域。比如在2016年全国卷III的满分作文《成功创业新模式:天地人和》中,提到了袁隆平、恩格斯、诗人特朗斯特罗姆,比尔·盖茨、托尔斯泰等人物,涉及农业、哲学、文学、创业等多个领域。通观近年的优秀作文,即使是陶渊明、鲁迅这样的常见人物,在一篇文章中通常也不会出现超过一次。

无论是句长方差还是名人出现频率,都指向一个共同点,那就是高考阅卷老师不喜欢花哨的套路,更喜欢在有限的篇幅里把内容讲清、讲透的简约“范儿”。想想也是,毕竟每份高考作文的平均阅卷时间相当短,一篇文章只有在做到结构清晰、修辞简约,才能提高易读性,从而引起阅卷老师的注意。

4

“零分作文”负能量太多

和历年的满分作文相比,还有一群另类的存在也同样获得了大家关注,那就是千奇百怪的“零分作文”。

和满分作文相比,零分作文在文本指标上会有哪些特点呢?

真的有点像托尔斯泰所说的,幸福的作文都是相似的,不幸的作文各有各的不幸。从句长方差、姓名识别等角度来分析零分作文,显著性并不突出。不过,如果从情感分析的角度切入,两者之间的差异还是很明显的。

2015年的天津卷的主题是“范儿”,可是有位段子手写出了题为《范儿是我女朋友》的作文。我们将之和当年的满分作文《独一无二的“中国范儿”》进行摘要处理和情感分析,所得结果如下:

标题

《范儿是我女朋友》

《独一无二的“中国范儿”》

主题句1

范儿语气有点不自然

是中华文化的“创新范儿”

情感值

0.7713343919267586

0.9869721130779494

主题句2

人生能得范儿这样的姑娘

这些都是我中华的气度

情感值

0.9545948477157727

0.8057497701520568

主题句3

最终也是只为我一个人而存在

不管是哪个时代都不缺乏创新的人物

情感值

0.5848549702359683

0.9266931283037393

主题句4

范儿冷不防重重地甩过来一个耳光

中华文明中

情感值

0.04490160433754031

0.9561216556364209

主题句5

她穿运动服的时候很有范儿

莫过于我中华的“文艺范儿”

情感值

0.6387204669811454

0.9949815693467886

上表中的情感值,表示该句子呈现出积极情绪的概率。从中可以看出,满分作文的每一段均体现出较强的“正能量”,而零分作文在情感表现上则有点“不阴不阳”,甚至还出现了“范儿冷不防重重地甩过来一个耳光”这样的“暴力”内容,被机器直接评出了0.04的低分,实在有点尴尬。

情感表现上的不“积极”事实上不止会带来“负能量”的观感,而且会让人觉得修辞色彩和意思表达不够明确。在高考评分标准中,符合“偏离题意、中心不明确、内容不当、思想不健康、感情虚假”等项就可评为0分作文。倘若情感上偏向负面,那么触碰这些红线的概率就大大提升了。

5

小结

前面,我们在达观AI机器君的协助下从内容和形式两方面对高考作文的命题和范文进行了分析。

从内容上说,高考命题始终紧紧围绕“我们自身”,“外部社会”以及“阅读”这三个主题,鼓励考生对个人人生和社会多思考多观察,并加强阅读积累,提升文化底蕴。

从形式上说,高考阅卷偏爱主题结构清晰,脉络连贯,修辞简约的风格,对于花哨的套路以及“负能量”较为“嫌弃”。

对文本处理技术感兴趣欢迎关注达观数据,每周都有技术干货分享,大咖小白都能各取所需。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-06-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 达观数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了
首先摆在AI面前的是2021年全国甲卷的考题,主题是“可为与有为”,具体题面如下:
量子位
2021/07/19
6430
爆肝 100 天,B 站 UP 主开发会写高考作文的 AI,内含 17 亿参数、2 亿数据、1 万行代码
前段时间,浙江高考满分作文《生活在树上》因为晦涩难懂的内容,刷爆了各种社交媒体。外行人看热闹,内行人看门道,大神们透过现象看本质。
GitHubDaily
2020/11/13
5950
爆肝 100 天,B 站 UP 主开发会写高考作文的 AI,内含 17 亿参数、2 亿数据、1 万行代码
我们只是好奇:各家大模型高考作文写的怎么样?
既然如今大模型被吹的如此厉害,今天又恰逢高考作文题目公开,那就组织一场 AI 大模型的高考如何?
机器之心
2023/08/04
3350
我们只是好奇:各家大模型高考作文写的怎么样?
还有两天就高考!B 站 UP 主用 AI 预测出2022年高考作文题,竟然是这些......
作者|李梅 编辑|陈彩娴 后天就要高考了,各位是不是已经开始紧张了(误)? 虽然咱不参加高考,但每年还是会例行关注一波高考作文题。毕竟都是被虐过的人,依稀还记得那些年的「丝瓜藤和肉豆须」、「举报我爹开车打电话」、「齐桓公、管仲和鲍叔」...... 而高考前,除了老师和考生,吃瓜群众也会积极投身于「语文作文押题」这一重大工程中 。 最近就有一位B站UP主 @图灵的猫 整出了新活,用AI预测出了今年高考最有可能出现的7大命题。 在视频里,UP主分别展示了这7个命题的「核心词」、「预测主题」和「模型表征」: 困
AI科技评论
2022/06/07
8430
还有两天就高考!B 站 UP 主用 AI 预测出2022年高考作文题,竟然是这些......
AI 考生挑战高考作文,平均 1 秒生成 1 篇,水平超 75% 考生
又到了一年一度大家最关心的高考时节,最近几天高考无疑是大家最关心的事情了。每次语文科目考完后,高考作文题总是会立马冲上热搜第一。
AI科技大本营
2022/09/04
5100
AI 考生挑战高考作文,平均 1 秒生成 1 篇,水平超 75% 考生
飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生
全国高考正在进行中,百度AI技术也迎来一场“高考”。6月7日,百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作,引发全网热议。AI写作涉及自然语言处理、数据挖掘、知识图谱等多项人工智能技术,百度使用飞桨文心大模型支持度晓晓又好又快地完成了高考作文的写作。据报道,度晓晓参与作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40秒就根据题目创作了40多篇文章,平均1秒生成1篇,随机抽取其中一篇,其分数已赶超约75%高考考生。
用户1386409
2022/08/31
4150
百度大脑神预测,命中多省高考作文题
光明科技讯2014年全国高考语文科目刚刚落幕,作文考题便引起网友极大的关注和热议,有网友惊奇地发现,多省高考作文题被百度大数据预测命中。这在中国传统教育行业中极为罕见,首次采用百度大数据预测高考作文题,也被一些媒体评价成为中国高考史上“首届大数据时代的高考”。 据悉,在高考之前,为了帮助考生更好地复习准备,百度大数据部为考生预测出2014年高考作文的六大命题方向,包括“时间的馈赠”、“生命的多彩”、“民族的变迁”、“教育的思辨”、“心灵的坚守”和“发展的困惑”等,其中每个作文主题又划定多个作文关键词。 从刚
大数据文摘
2018/05/22
8450
阅卷老师给腾讯元宝的高考作文打了个分
随着互联网和人工智能的发展,它们能解答的问题越来越多,请问人类的问题会越来越少吗?以上材料引发了你怎样的联想和思考?请写一篇文章。
小腾资讯君
2024/06/07
3940
阅卷老师给腾讯元宝的高考作文打了个分
0分!数字人直播挑战上海高考英语作文“翻车”了
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 考完语文考英语,但这一次,AI数字人却“大翻车”。 这不前脚上海高考英语作文题目公布了嘛。 后脚AI数字人就又双叒叕要去开直播挑战了。 然鹅……专家现场给出的分数,简直令人大跌眼镜——0分!!! 直播间的弹幕瞬间“炸”了,画风是这样的: 好奇的友友们就要问了,之前高考语文作文都能hold住的AI数字人,为啥英语作文就搞不定呢? 其实,这只是AI数字人在直播过程中的一个小插曲。 是TA在看了上海高考英语卷子之后,根据题目在作文中画了张插画。 因为写作过
量子位
2022/07/12
6850
0分!数字人直播挑战上海高考英语作文“翻车”了
用AI写出的高考作文!
今天是6月7日,又到了每一年高考的日子。小灰自己参加高考是在2004年,距离现在已经将近20年,现在回想起来,真的是恍如隔世。
小灰
2023/09/02
1970
用AI写出的高考作文!
AI 写的高考作文,你打几分?
又是一年高考时,高考真的是人生的一件大事,毕业这么多年,每次看到高考相关信息,还是会不由自主的点进来,其中语文的作文是每年大伙津津乐道的话题。
程序员树先生
2023/06/08
3211
AI 写的高考作文,你打几分?
使用 GPT-4 创作高考作文 2024年
作为一名技术博主,我常常思考如何利用人工智能(AI)来提升内容的质量和SEO效果。今天,我将分享如何使用 GPT-4 创作一篇高考作文,并结合多级标题结构和丰富的内容,优化博客文章的搜索引擎优化(SEO)。在这篇文章中,我们将详细探讨 GPT-4 的应用,并通过代码案例演示其强大功能。希望这篇文章对你有所帮助,并激发你更多的创作灵感。
默 语
2024/11/22
1520
AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
今天是高考第一天,我猜,你一定在看全国各地那些奇奇怪怪的高考作文题,还要纠结一下:
量子位
2020/07/14
8790
让 AI 写高考作文!10 款大模型 20 秒“交卷”,自评最高 55 分
就在今天上午 9:00,2024 年高考正式拉开帷幕。据教育部统计,今年全国高考报名人数 1342 万人。12 年寒窗苦读,高考成为众多考生人生的转折点之一。
用户9861443
2024/06/11
2370
让 AI 写高考作文!10 款大模型 20 秒“交卷”,自评最高 55 分
VR有多火?这一次成了2016年浙江高考作文题目!
目前,2016年高考语文已经结束,作为该科目重头戏,各大省市的高考作文试题随之出炉。其中,“最科技”的浙江高考作文题目赢得了VR圈的疯狂点赞。 浙江卷高考作文题: 网上购物,视频聊天,线上娱乐,已成为
镁客网
2018/05/28
5010
百元级 AI 显卡巅峰对决:Tesla M40 24G vs AMD MI50 32G,谁是真正的性价比之王?对决第一回合!
你好,我是术哥,云原生开源技术布道者:KubeSphere Ambassador、Milvus 北辰使者。很高兴在「运维有术」与你相遇。
运维有术
2025/06/08
2.4K0
百元级 AI 显卡巅峰对决:Tesla M40 24G vs AMD MI50 32G,谁是真正的性价比之王?对决第一回合!
让GPT4、文心一言、讯飞星火写2023高考作文,就这?
昨天中午,2023年的语文高考结束之后,各地方的语文作文也都新鲜出炉了;每年高考结束之后,总会出现几篇传世佳作,让我们惊叹作者的文笔以及中文的魅力;而今年作为AI元年,国内外各大厂纷纷发布AI大模型,人类的创作能力迎来的新的挑战;当我们把这些高考作文命题分别交给GPT 4、百度文心一言、科大讯飞星火,是否也能产出惊世之作呢?一起来试试!
一行Java
2023/09/04
4670
让GPT4、文心一言、讯飞星火写2023高考作文,就这?
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
机器之心原创 作者:杜伟 能互动、擅写作、会作画,百度数字人度晓晓应了这样一句话,「天空才是她的极限」。 这年头,数字人直播带货、虚拟主播、银行客服,这些应用场景已经不再是多稀奇的事了。从时尚娱乐到文化商业,数字人迎来了全面开花。国内大厂也纷纷抓住数字人这个发展机遇,推出花样百出的娱乐和实用性数字人产品,致力于让数字人更智能化更服务化。 百度 2020 年 9 月推出的国内首个可交互虚拟偶像度晓晓,最近用她的智能互动、写作和绘画表现让人们见识到了 AI 大模型的能力。 6 月 14 日,一段由百度打造的度晓
机器之心
2022/06/24
7520
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
国产大模型参加高考,同写2024年高考作文,及格分。
有点好奇,就加了几个国外选手参赛:Gemini Advanced、Claude-3-Sonnet、GPT-4o,个人认为写的还不错。
Ai学习的老章
2024/06/11
1730
国产大模型参加高考,同写2024年高考作文,及格分。
AI空谈情怀,也是要输的 | 人机辩论大战
蓝色的舞台上,正中间立着一块黑色的面板,面板上蓝色的扁圆形屏幕正在闪动,后面传出冷静而理性的女声。
量子位
2019/03/08
4530
AI空谈情怀,也是要输的 | 人机辩论大战
推荐阅读
把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了
6430
爆肝 100 天,B 站 UP 主开发会写高考作文的 AI,内含 17 亿参数、2 亿数据、1 万行代码
5950
我们只是好奇:各家大模型高考作文写的怎么样?
3350
还有两天就高考!B 站 UP 主用 AI 预测出2022年高考作文题,竟然是这些......
8430
AI 考生挑战高考作文,平均 1 秒生成 1 篇,水平超 75% 考生
5100
飞桨文心大模型挑战高考作文:平均1秒生成1篇,水平超75%考生
4150
百度大脑神预测,命中多省高考作文题
8450
阅卷老师给腾讯元宝的高考作文打了个分
3940
0分!数字人直播挑战上海高考英语作文“翻车”了
6850
用AI写出的高考作文!
1970
AI 写的高考作文,你打几分?
3211
使用 GPT-4 创作高考作文 2024年
1520
AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
8790
让 AI 写高考作文!10 款大模型 20 秒“交卷”,自评最高 55 分
2370
VR有多火?这一次成了2016年浙江高考作文题目!
5010
百元级 AI 显卡巅峰对决:Tesla M40 24G vs AMD MI50 32G,谁是真正的性价比之王?对决第一回合!
2.4K0
让GPT4、文心一言、讯飞星火写2023高考作文,就这?
4670
当被大模型输入技术内功,数字人「文画两开花」,还在手机里随时陪你聊天
7520
国产大模型参加高考,同写2024年高考作文,及格分。
1730
AI空谈情怀,也是要输的 | 人机辩论大战
4530
相关推荐
把毛选和鲁迅全集喂给AI后,写出来的高考作文太对味了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档