七大年夜模型参加高考后分数出炉：AI参加理科高考只能上二本！_模子_理科

2024-10-08 17:30:11 云服务

就在今年的6月份，上海人工智能实验室旗下司南评测体系OpenCompass对7个AI大模型进行高考题目测试，并且进行比较，看看在这几个大模型中他们分别在高考考试中的表现如何？哪个模型是表现最好的？如果让AI参加高考的话，他们几个当中，他们都会被哪所大学录取？

七大年夜模型参加高考后分数出炉：AI参加理科高考只能上二本！_模子_理科云服务

终极经由测试往后，AI模型的分数也被公布了出来，个中来自于上海人工智能实验室&商汤科技联合研发的模型InternLM-WQX+VL-20B，在理科考试中的表现分别为，语文112分，数学74分，英语138.5分，物理39分，化学48分，生物57分，历史82分，地理58分，政治67分，理科总分是468.5分，文科总分是531.5分。

而来自于OpenAl模型的GPT-40，语文是111.5分，数学73分，英语141.5分，物理36分，化学46分，生物65分，历史88分，地理59分，政治58分，理科总分是467分，文科总分是531分。
从公布的分数来看，文科最高分是阿里通义千问大模型，得到了546分，理科最高分则是上海人工智能实验室&商汤联合研发的浦语文曲星，达到了468.5分。

那么几个大模型分分数，按照现在高考的分数线打算的话，表现最好的模型在2024年河南本科批次录取中，文科成绩过一本，理科超二本。
其他模型则连二本线都未过！
如果按照文科考试的成绩打算的话，通义千问、诗人浦语文曲星、GPT-4o的文科成绩均超越一本线，也便是说这些大模型在理解能力上和知识储备上十分丰富！

那么有人推测，大模型有着很强大的学的能力，在经由一段韶光的演习之后是否可以达到985的水平呢？对此，老师们同等认为虽然在根本知识方面，大模型表现尚可，但是在逻辑推理方面则有些差强人意！
尤其是在解答数学题的时候，更能明显看出，解题过程机器且逻辑性差。