前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >高考即将来临,这五款A I应用,哪个有望成为学 习神器?

高考即将来临,这五款A I应用,哪个有望成为学 习神器?

作者头像
山行AI
发布于 2024-06-06 07:52:13
发布于 2024-06-06 07:52:13
3180
举报
文章被收录于专栏:山行AI山行AI

早就听说A I原生应用的实用性很强,高考即将来临,学生们进入冲刺期。对于学生党来讲,哪款应用有可能成为他们的“学 习神器”呢?

这篇文章里,我们选择了历史、语文、英语三个科目的2023年高考题,对文心一言app、通义千问、元宝等五款热门应用做了评估和对比,我们一起来看看谁的解题能 力更为优秀。

一、历史

虽然每款应用只测评了6道题,但其实力对比一目了然。文心一言以只错一道题的高准确率问鼎五款应用第 一的位置。它还可以延展相关知识点,帮助考生举一反三掌握考 试要点。相对比元宝、G P T、海螺问问、通义的准确率都不及文心一言

历史题都有固定答案,这样来看,数据训练上,文心一言更为成熟。

二、英语

国产大模型的英文能 力丝毫不逊色于G P T!在此次英文考卷的阅读理解测试中,文心一言准确率十分不错。

英语阅读一直困扰着很多小伙伴,很多人对单 词在语句中的应用有很大的难题。而文心一言不光能给我们提供正确的答案,更是能帮我们真正理解文章内容,让我们能够在每场考 试积累更实用的经验。

三、语文阅读理解

语文阅读理解需要考生们在短时间内阅读并剖析一篇文章,是不少考生的老大难。对于有实力的应用来说,真金不怕火炼,也是考验其综合能力的时刻。

经过测评,我们发现,文心一言的回答质量与参考答案很接近,且都踩在得分点上。与此同时,它不仅仅是回答一个问题,而是用更详尽的语句帮助考生理解文章主旨,帮助考生真正学会理解并解决一道考试问题。相比较通义回答则略显啰嗦,而G P T、海螺问问、元宝都有部分偏离得分点或没有遵循指令给解题思路的问题。

文心一言不光在答题上出色,作为国内领先的AI应用,在人类对齐能力评测中,表现优异,和其他模型拉开明显差距;在企业选择大模型最看重的安全性评测上,文心一言表现亮眼,力压国际一流模型。值得注意的是,文心一言在应用落地上也是一路领先。自去年3月16日文心一言首发至今,用户数已突破2亿,每天API调用量也突破了2亿,名副其实为国内头部模型。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 山行AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大模型的高考数学成绩单:及格已经非常好了
和往年一样,除了让 AI 大模型写写高考作文,我们也选取了六家国内头部大模型公司的产品与考生们一同参与一场客观且公平(让众多考生头皮发麻)的高考数学考试(新课标 Ⅰ 卷),其中包括 GPT-4o、GLM-4、文心一言 4.0、豆包、百小应(百川 4)以及通义千问 2.5。
机器之心
2024/06/17
1740
大模型的高考数学成绩单:及格已经非常好了
AI 第一次高考:记得作文要龙头猪肚凤尾
让不同的AI模型参与高考作文的写作,我们不仅可以检验它们在自然语言处理方面的能力,还能比较它们在内容创意、逻辑构建和语言运用等方面的表现。本篇文章将深入探讨各大AI模型在高考作文写作中的表现,以期揭示AI写作能力的现状和未来潜力。
AI科技评论
2024/06/17
1230
AI 第一次高考:记得作文要龙头猪肚凤尾
让 AI 写高考作文!10 款大模型 20 秒“交卷”,自评最高 55 分
就在今天上午 9:00,2024 年高考正式拉开帷幕。据教育部统计,今年全国高考报名人数 1342 万人。12 年寒窗苦读,高考成为众多考生人生的转折点之一。
用户9861443
2024/06/11
1200
让 AI 写高考作文!10 款大模型 20 秒“交卷”,自评最高 55 分
阿里版 ChatGPT 官宣!我们用 16 个提问,火速进行了测评……
整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 平地一声雷!今天中午阿里版类 ChatGPT 「通义千问」突然官宣: 没错,就这 3 行简短介绍 + 1 个官网地址,再无其他“剧透”。 好在,CSDN 有幸拿到了「通义千问」的第一批内测邀请码!既能第一时间体验这神秘的「通义千问」,那就让我们一同看看:这个阿里版 ChatGPT,它的水平究竟如何? 自我介绍 首先,让「通义千问」来个官方的自我介绍:介绍一下你自己吧。 相信许多人都好奇「通义千问」的优势何在,那就让它自己回答:你与其
AI科技大本营
2023/04/10
9830
阿里版 ChatGPT 官宣!我们用 16 个提问,火速进行了测评……
当 AI 遇到高考作文!实测 ChatGPT、文心一言、通义千问等 8 款“神器”
身处技术圈的我们,对于这句话可能有很多话想说。而对于这个话题,也想问问近来大火的 AI 技术本身——之前总是听闻 AI 考过律师考试、大战高数题等,这次,我们让 AI 来写写高考作文,看看它的水平如何。
用户10598074
2023/06/07
6941
0分!数字人直播挑战上海高考英语作文“翻车”了
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 考完语文考英语,但这一次,AI数字人却“大翻车”。 这不前脚上海高考英语作文题目公布了嘛。 后脚AI数字人就又双叒叕要去开直播挑战了。 然鹅……专家现场给出的分数,简直令人大跌眼镜——0分!!! 直播间的弹幕瞬间“炸”了,画风是这样的: 好奇的友友们就要问了,之前高考语文作文都能hold住的AI数字人,为啥英语作文就搞不定呢? 其实,这只是AI数字人在直播过程中的一个小插曲。 是TA在看了上海高考英语卷子之后,根据题目在作文中画了张插画。 因为写作过
量子位
2022/07/12
5430
0分!数字人直播挑战上海高考英语作文“翻车”了
对打GPT-4,文心一言抢先实测!画「林黛玉倒拔垂杨柳」很惊艳,但写代码不大行
---- 新智元报道   编辑:编辑部 【新智元导读】热乎的文心一言测评报告出炉了!虽然有些任务被吊打,但要论中国文化的博大精深,它可不输GPT-4。 昨天,百度没有现场demo的发布会,似乎被群嘲了一波。 一位穿白衬衣、黑裤子,系一条白色腰带的美男子,给我们带来了一场中规中矩、似乎缺乏亮点的演示。 不过,CEO的腰带和颜值倒是出了圈。 有人调侃,这些天被ChatGPT、GPT-4整焦虑的人,发布会后忽然又觉得自己可以了。 但是拿到内测码的小编,火速测评了一波。 看着文心一言洋洋洒洒腾蛟起凤
新智元
2023/03/29
7790
对打GPT-4,文心一言抢先实测!画「林黛玉倒拔垂杨柳」很惊艳,但写代码不大行
实测9款AI文件助手!原来最好用的并不是全网称赞的谷歌NotebookLM...
任意喂一份文档给NotebookLM,可以获取该文档的摘要,生成FAQ(常见问题)、学习指南、笔记、内容架构等形式。用户还可以针对上传的文档向NotebookLM提出具体问题,它会基于文档内容给出回答。
可信AI进展
2024/10/12
3300
全球140+大模型全方位评测结果出炉,智源评测体系发布
2024 年 5 月 17 日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外 140 余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。
机器之心
2024/05/22
4500
全球140+大模型全方位评测结果出炉,智源评测体系发布
厦门大学首发多模态阅读理解新任务: 图文深度融合数据集VEGA
多模态大型语言模型(MLLMs)的高速发展彰显了其在处理图文信息方面的强大潜力。然而,目前的多模态模型和方法主要集中于处理基础视觉问答(VQA)任务,这些任务通常只涉及与问题强相关的有限图片和文本信息。在实际应用中,尤其是文档理解领域,模型经常需要处理更为复杂的图文混合输入,这些输入不仅长度更长,而且可能包含冗余甚至误导性的信息。现有的主流MLLMs在处理此类复杂任务时表现不佳,且缺乏相应的Benchmark来评估模型在这些任务上的性能。
CV君
2024/07/12
4110
厦门大学首发多模态阅读理解新任务: 图文深度融合数据集VEGA
直击高考人机大战:技术、争议与人族胜利
允中 发自AI考区 量子位 报道 | 公众号 QbitAI 6月7日17点,2017年第一日高考结束,数学学科停笔交卷的铃声划破长空。 北京第八十中学望京校区人潮涌动,结束数学厮杀的考生正陆续走出考场,有欢有悲,神色各异。 也在此时,相隔5公里外的丽都皇冠假日酒店,另一场同样试题的考试已经展开,名为Aidam的人工智能程序,据称在200技术工程师、经历3年研发、吃下50万道考题后,开始正式尝试2017年新课标文科数学卷。 为了对照,主办方教育科技公司学霸君,还邀请了去年6位各省高考状元,两两组队组合作为人族
量子位
2018/03/29
8850
直击高考人机大战:技术、争议与人族胜利
现在的大模型榜单,真就没一个可信的。
上周,AI圈有个很炸裂的大模型发布,在全网引起了山呼海啸,一众从业者和媒体尊称它为开源新王。
数字生命卡兹克
2025/04/14
620
现在的大模型榜单,真就没一个可信的。
谁才是最强的?清华给海内外知名大模型做了场综合能力评测
在 2023 年的 “百模大战” 中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。
机器之心
2024/04/19
1.9K0
谁才是最强的?清华给海内外知名大模型做了场综合能力评测
DeepSeek将成为零售电商行业的“生意参谋”
在过去短短一个多月的时间里,已有数百家公司接入DeepSeek,这里除了同行的AI创业公司,还有腾讯元宝、文心一言、阿里通义千问这样的大公司AI产品,以及阿里钉钉、字节飞书这样的办公App。
庄帅
2025/02/28
1450
DeepSeek将成为零售电商行业的“生意参谋”
让机器人来参加高考,你觉得它哪门最好?
一年一度的高考即将拉开大幕。高考对于大部分的学生来说,就像是一次千军万马过独木桥的挑战。今年,考生除了需要面对人类自身的挑战外,还迎来了一个特殊的竞争对手——机器人。 据成都当地媒体报道,6月7日下午5时许,一场特别的考试将在成都举行:“准星数学高考机器人” AI-MATHS,将在公证机构和媒体的见证下,挑战2017年高考数学题。 AI-MATHS是成都准星云学科技有限公司研发设计的高考机器人。该公司首席执行官、清华大学苏州研究院大数据中心主任林辉介绍,AI-MATHS诞生于2014年,是依托清华大
机器人网
2018/04/25
7450
让机器人来参加高考,你觉得它哪门最好?
文心一言 vs GPT-4 —— 全面横向比较
作为一个大语言模型,我认为最重要的能力是“语义理解”能力,也就是要能听得懂人话。这一轮PK我将问文心一言和ChatGPT一些日常常见的问题和任务,看它们回答得怎么样。
机器学习AI算法工程
2024/04/30
1.8K0
文心一言 vs GPT-4 —— 全面横向比较
推理模型的“年终考试”,谁是国内目前最好的“o1”?
思考是文明存在的根本,是人类探索未知的永恒追求,现在也成了大模型技术演进的一个重要方向。
Alter聊科技
2024/12/31
1410
别再说国产大模型技术突破要靠 Llama 3 开源了
近日,千呼万唤之下,Meta终于发布了开源大模型Llama 3的 8B 和 70B 版本,再次震动 AI 圈。
AI科技评论
2024/05/06
4150
别再说国产大模型技术突破要靠 Llama 3 开源了
阿里版ChatGPT突然上线邀测!大模型热战正剧开始,这是第一手体验实录
萧箫 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 阿里正式加入ChatGPT战局! 就在刚刚,阿里版类ChatGPT突然官宣正式对外开放企业邀测。 它叫通义千问,由达摩院开发。 嗯,是大模型版十万个为什么那个味儿了。 事实上,早在这个月初,就传出过不少阿里要推出类ChatGPT的消息,不过普遍预期在11号左右。 而前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT,就是基于大模型的“压缩版”,已经以其惊艳表现把网友的胃口吊了起来,让众人将目光投向阿里。 如今“正菜”提前上桌,自然一点即着,引爆
量子位
2023/04/10
1820
阿里版ChatGPT突然上线邀测!大模型热战正剧开始,这是第一手体验实录
学界 | 两位AI考生今年走上高考考场,而且数学已经考及格了
2017年高考今天就结束了,跟往年一样的是作文题目出来以后引发网友吐槽和创作、交警组织送考车队、以及帮迷路和丢失准考证的考生及时赴考。不一样的也有,那就是来自清华大学苏州研究院的高考机器人AI-MATHS和来自教育机构“学霸君”的智慧教育机器人Aidam,它们都通过数学试卷和人类一绝高下。 考试结果是,AI-MATHS在2017文科数学北京卷获得105分,在2017文科数学全国卷II获得100分;Aidam在2017文科数学全国卷获得134分,不过它需要人工为机器人输入题目,审题难度大大降低了。 下面 AI
AI科技评论
2018/03/13
1.4K0
学界 | 两位AI考生今年走上高考考场,而且数学已经考及格了
推荐阅读
大模型的高考数学成绩单:及格已经非常好了
1740
AI 第一次高考:记得作文要龙头猪肚凤尾
1230
让 AI 写高考作文!10 款大模型 20 秒“交卷”,自评最高 55 分
1200
阿里版 ChatGPT 官宣!我们用 16 个提问,火速进行了测评……
9830
当 AI 遇到高考作文!实测 ChatGPT、文心一言、通义千问等 8 款“神器”
6941
0分!数字人直播挑战上海高考英语作文“翻车”了
5430
对打GPT-4,文心一言抢先实测!画「林黛玉倒拔垂杨柳」很惊艳,但写代码不大行
7790
实测9款AI文件助手!原来最好用的并不是全网称赞的谷歌NotebookLM...
3300
全球140+大模型全方位评测结果出炉,智源评测体系发布
4500
厦门大学首发多模态阅读理解新任务: 图文深度融合数据集VEGA
4110
直击高考人机大战:技术、争议与人族胜利
8850
现在的大模型榜单,真就没一个可信的。
620
谁才是最强的?清华给海内外知名大模型做了场综合能力评测
1.9K0
DeepSeek将成为零售电商行业的“生意参谋”
1450
让机器人来参加高考,你觉得它哪门最好?
7450
文心一言 vs GPT-4 —— 全面横向比较
1.8K0
推理模型的“年终考试”,谁是国内目前最好的“o1”?
1410
别再说国产大模型技术突破要靠 Llama 3 开源了
4150
阿里版ChatGPT突然上线邀测!大模型热战正剧开始,这是第一手体验实录
1820
学界 | 两位AI考生今年走上高考考场,而且数学已经考及格了
1.4K0
相关推荐
大模型的高考数学成绩单:及格已经非常好了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档