七大年夜模型参加高考后分数出炉:AI参加理科高考只能上二本!_模子_理科
就在今年的6月份,上海人工智能实验室旗下司南评测体系OpenCompass对7个AI大模型进行高考题目测试,并且进行比较,看看在这几个大模型中他们分别在高考考试中的表现如何?哪个模型是表现最好的?如果让AI参加高考的话,他们几个当中,他们都会被哪所大学录取?
终极经由测试往后,AI模型的分数也被公布了出来,个中来自于上海人工智能实验室&商汤科技联合研发的模型InternLM-WQX+VL-20B,在理科考试中的表现分别为,语文112分,数学74分,英语138.5分,物理39分,化学48分,生物57分,历史82分,地理58分,政治67分,理科总分是468.5分,文科总分是531.5分。
而来自于OpenAl模型的GPT-40,语文是111.5分,数学73分,英语141.5分,物理36分,化学46分,生物65分,历史88分,地理59分,政治58分,理科总分是467分,文科总分是531分。从公布的分数来看,文科最高分是阿里通义千问大模型,得到了546分,理科最高分则是上海人工智能实验室&商汤联合研发的浦语文曲星,达到了468.5分。
那么几个大模型分分数,按照现在高考的分数线打算的话,表现最好的模型在2024年河南本科批次录取中,文科成绩过一本,理科超二本。其他模型则连二本线都未过!
如果按照文科考试的成绩打算的话,通义千问、诗人浦语文曲星、GPT-4o的文科成绩均超越一本线,也便是说这些大模型在理解能力上和知识储备上十分丰富!
那么有人推测,大模型有着很强大的学的能力,在经由一段韶光的演习之后是否可以达到985的水平呢?对此,老师们同等认为虽然在根本知识方面,大模型表现尚可,但是在逻辑推理方面则有些差强人意!
尤其是在解答数学题的时候,更能明显看出,解题过程机器且逻辑性差。
本文系作者个人观点,不代表本站立场,转载请注明出处!