随着2025年北京中考的圆满落幕,11.05万名考生完成了这场意义非凡的考试。此次中考,作为北京新一轮中考改革的首次实践,考试时间由往年的三天精简至两天,而考试内容和形式也发生了翻天覆地的变化。总分值从670分降至510分,道德与法治科目更是首次采用开卷考试形式,这无疑增加了考试的挑战性和不确定性。总分降低,意味着每一分的争夺都更为激烈,高分段的竞争更是白热化。
各学科命题也紧扣时代脉搏,更加注重考查学生的核心素养和关键能力。数学科目中,简单题的占比大幅下降,取而代之的是创新性强、难度大的新题型,如新函数、圆综题等,旨在提升学生的区分度和思维能力。语文科目则着重考查学生对语言文字的基本功和感受能力,引导学生在具体情境中运用语言文字解决问题。从考生的反馈来看,这场中考的难度可谓“难如登天”,不少考生直呼“被难哭了”。
面对如此高难度的中考,我们不禁产生一个大胆的设想:如果把当下主流的AI大模型当作中考考生,它们能否在这场考试中一战成名?为了解答这个问题,我们精心挑选了七款最具代表性的AI大模型——DeepSeek、字节豆包、讯飞星火、通义千问、腾讯混元、文心一言以及GPT,让它们迎战2025北京中考的语文作文、英语作文以及数学全卷。

为了确保测试的公平性和准确性,我们统一关闭了所有大模型的联网功能,并开启了深度推理模式。语文作文和英语作文以文本形式提问,并特邀前人大附中分校语文名师、中考命题高级研究员李豪,以及中考语文资深教研专家金宇佳参与评分。两位资深语文教育专家分别进行打分,并取平均值作为最终成绩。
这场别开生面的“AI大模型中考”不仅考验了AI技术的实力,也为我们提供了一个全新的视角来审视AI在教育领域的应用潜力。究竟哪款AI大模型能够在这场考试中脱颖而出,成为传说中的“学霸尖子生”?让我们拭目以待。