这次高考测试满分为420分,阿里通义千问以总分303分的成绩脱颖而出,排名第一,GPT-4o紧随其后,得分296分。
虽然三大模型的均匀成绩都超过了70%,但在数学科目上的表现却不尽如人意。
最高分仅为75分,来自上海人工智能实验室的诗人.浦语2.0。
与总分的落差显示出数学对付大模型来说仍是一个难点。

AI 高考分数大年夜揭秘!快来一商量竟!_模子_总分 智能助手

不过,大模型在语文和英语方面的表现却相称不错,尤其是语文方面,通义千问更是展现出了出色的实力。
这次AI大模型的高考测试不仅让我们看到了它们的个体差异和不敷之处,更让我们看到了AI技能在教诲领域的巨大潜力。

只管大模型在某些学科上已有不俗表现,但仍有很大的提升空间。
让我们一起期待AI技能在未来能够更好地做事于人类社会吧!