一年一度高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。AI大模型数学功底到底如何?比人类“聪明”吗?搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。
在测试中,搜狐科技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。
(资料图片仅供参考)
测试结果显示,这五款大模型在答数学题的能力上差异显著。
最“聪明”的讯飞星火答对了5题,正确率50%。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。
360智脑和通义千问则“全军覆没”,一道题也没答对,交了白卷。
值得一提的是,昨天搜狐科技也用五款大语言模型产品,对高考作文全国卷(甲)进行了测试,并邀请了5位语文名师打分。
打分结果显示,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。
虽然语文作文题和数学计算题,对大模型能力考察的维度并不尽相同。但巧合的是,不擅长写作文的360智脑和通义千问,似乎也不擅长做数学题。
通过这两次高考题测试,也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”,那么360智脑和通义千问则是妥妥的“学渣”。
附测试中使用的高考数学题题目:
1.不等式|x-2|<1的解集为__
2.a=(2,3),b=(-1,2),则a·b=__
3.首项为3,公比为2的等比数列的前六项和S6=__
4.tanA=3,tan2A=__
5.f(x)={2^xx>0;1,x≤0}的值域为__
6.复数z=1-i,则|1+iz|=__
7.圆的方程x^2+y^2-4y-m=0的面积为π,则m=__
8.三角形的三边长为a=4,b=5,c=6,则sinA=__
9.某地一年四个季度的GDP(亿元),第一季度GDP为232,第四季度GDP为241,且四个季度的GDP逐季度增长,中位数、平均数相等。则该地一年的GDP为__
10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正数k的最大值为__
责任编辑:
标签:
一年一度高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。
大美龙泉驿活力新视觉丨“花开龙泉驿”第一季度优秀作品公布小满之...
王刘芳分享创业故事。奉化区人民政府新闻办供图中新网宁波6月8日电(记
最近水逆不断的万达集团,让王健林有点头疼!在大规模裁员、160亿出售2
1、天使之家瓷砖属于二线品牌,是由佛山市天使之家陶瓷有限公司所生产
红网时刻新闻6月8日讯(记者张珍)在主题教育中,湖南省信访局深入学习
1、视频拍摄脚本一、表现人走路镜头景别摄法、技巧时间画面内容音效1全
8~9日,三明(宁化、清流)、龙岩(长汀、武平)、莆田、厦门(同安)
海洋覆盖了地球表面的70%以上对人类社会生存和发展具有重要意义我国高
上海AI实验室与商汤科技等发布「书生·浦语」大语言模型6月7日,上...
据外媒报道,花旗称,投资者担心特斯拉可能放弃宁德时代转向其他供
(记者沙晗汀)美国前副总统彭斯当地时间7日在艾奥瓦州宣布,将参加2024
想必现在有很多小伙伴对于历史唯物主义和辩证唯物主义区别方面的知识都
想必现在有很多小伙伴对于价值的本质方面的知识都比较想要了解,那么今
6月1日,小摩增持药明康德(02359)27 7491万股,每股作价66 8735港元,
k线中的红黄绿代表什么?k线图中的红线、黄线、绿线表示的是一只股票的
从6月8日起可以购买端午节假期首日的车票啦准备出行的小伙伴↓↓赶紧收
走进四川省泸州市纳溪区丰乐镇保安村猕匠农业科技有限公司的猕猴桃种植
创业板方面,指数早间低开震荡走低,午盘前低位震荡;午后指数再度震荡
中油工程近日披露的投资者关系活动记录表显示,公司主动融入服务国...
华塑科技06月07日主力资金净流出1627 59万元,涨跌幅为-4 87%,主力净
5月29日至30日,由浙江省舟山市检察院提起的9起非法捕捞、收购水产品民
1、江面上的天空没有尘埃,天上有一轮孤月。徐若张汤——号,《春江...
根据猎聘大数据研究院发布的《2023Q1就业趋势大数据报告》,从新发职位
06月07日,东田微股价大涨。截至今日收盘,东田微上涨20 00%,收盘价为
想必现在有很多小伙伴对于制订还是制定方面的知识都比较想要了解,那么
云南省丽江市华坪县新庄傈僳族乡腊么村依托得天独厚的核桃林资源,近些
工人日报-中工网记者田国垒通讯员李道伟6月6日,记者从山东省住房和城
“上海黄浦杯”长三角地区城市职工台球邀请赛。经过为期5天的激烈争...
著名经济学家徐洪才:中国新型城市化还有后半场,到2050年要建立现代化