难上热搜的高考数学，我拿ChatGPT和豆包PK了一把！

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 难上热搜的高考数学，我拿ChatGPT和豆包PK了一把！十三 2026-06-08 16:28:48 来源：量子位豆包硬刚ChatGPT 金磊发自凹非寺量子位 | 公众号 QbitAI 今年高考数学，又把不少人做沉默了。从考场出来后，很多考生的第一反应不是有几道题不会，而是怎么每一道都这么能算。于是乎，计算量大、题型新、区分度高，成了这张卷子被讨论最多的几个关键词。更有意思的是，另一个问题也被顺手推上了台面：如果把这张卷子交给AI，它到底会不会做？我们平时会看到有些网友吐槽，AI在计算一些简单问题时会出错，怎么能答对从没见过的新高考题？但这里有一个容易被忽略的细节，很多吐槽针对的是默认的快速模式，适合日常问答；而复杂数学、逻辑推理、编程分析这类任务，真正的打开方式应该是让模型深度思考。所以这次，我们把问题拆开看。同一张高考数学卷，分别交给豆包思考模式和 ChatGPT（GPT-5.5），按照教育场景常用的图像输入进行测试，结果会怎样？先说结论。豆包思考模式和ChatGPT都能给出相当稳定的解题表现。尤其是在需要多步推理、函数分析、概率建模、解析几何计算的题目上，AI已经可以按照人类解题路径一步步推进了。 AI们的答案汇总如下：（根据目前网传的试题和答案验证，豆包和ChatGPT在选择题和填空题上全都回答准确。解答题部分还需要专业老师评估过程分数。）那么AI做高考数学，强在哪里？又容易卡在哪里？我们继续往下看详细实测过程。单选题：前几道选择题看起来很基础，但并不等于机械计算。比如第1题，中位数；第2题，平面向量线性表示；第3题，三角函数值与集合交集；第4题，导数与切线方程。这些题人类考生做起来不算特别难，但对AI来说，其实会同时考几个能力：读懂题干，识别考点，调用公式，完成计算，还要避免在最后一步把选项看错。到了后面，题目明显开始拉开梯度。比如抛物线焦点距离、函数最大值反推参数、古塔排列中的等差数列分组、空间点集里的数学期望。接下来，我们分别给豆包思考模式和 ChatGPT ，每个题单独截图输入，并附上简单一句“解答这道题”。第一题：豆包和ChatGPT答案如下：这道题比较简单，豆包和ChatGPT从思路和答案上来看，没有任何问题。第二题：豆包和ChatGPT答案如下：两者都抓住了“向量a、b不共线”这一关键条件，转化为对应系数相等。整体看，这类题对当前头部AI难度不高。第三题：豆包和ChatGPT答案如下：这题容易错在特殊角的符号上，豆包和ChatGPT都逐项计算后再取交集，思路比较规范。差异主要在表述详略，结论一致。第四题：豆包和ChatGPT答案如下：两者都准确完成了求导、代入斜率、写切线方程三步，没有把函数值和导数值混淆。作为导数基础题，表现稳定。第五题：豆包和ChatGPT答案如下：这题开始要求先由点确定抛物线参数，再转为焦点坐标求距离。豆包和ChatGPT都能把计算链条走完，说明基础解析几何能力比较扎实。第六题：豆包和ChatGPT答案如下：相比前几题，这道题需要把“最大值为1”转化成参数约束。两者都能给出完整推导，但这类题也更能暴露中间计算是否严谨。第七题：豆包和ChatGPT答案如下：这题的难点在于先把“一百零八塔”的情境转成数列条件。豆包和ChatGPT都能识别等差结构并构造分组，说明对中文长题干的理解较稳。第八题：豆包和ChatGPT答案如下：关键点在于样本空间删去了P(1,1,1)，不能直接套“对称所以期望为0”。两者都抓住了删点带来的扰动，这是本轮测试里比较有代表性的推理点。多选题：第九题：豆包和ChatGPT答案如下：多选题不能只算一个结论，必须逐项验证。豆包和ChatGPT都对共轭、模长、平方和复数除法分别判断，整体比较细。第十题：豆包和ChatGPT答案如下：空间几何多选题对直觉判断并不友好，两者都倾向于通过坐标或几何约束逐项排除。ChatGPT的排除过程更直接，豆包的推导更展开。第十一题：豆包和ChatGPT答案如下：这一题对圆与直线交点条件的拆解要求较高，两者在部分选项判断上出现了差异。这里也提醒我们，多选综合题仍需要结合标准答案做人工核验。填空题：第十二题：豆包和ChatGPT答案如下：填空题没有选项兜底，两者都能把双曲线化为标准形式，并通过a、b、c关系求离心率。结论形式虽可等价变化，但核心计算一致。第十三题：豆包和ChatGPT答案如下：这题同时考奇偶性和单调性，需要先锁定参数范围再计算函数值。豆包和ChatGPT都能沿着性质推导，思路比较完整。第十四题：豆包和ChatGPT答案如下：数列构造题的难点在于从条件中抽出可用规律，而不是直接代公式。两者都尝试先求连续三项和，再分析等比关系，推理链条较长但方向清楚。解答题：第十五题：豆包和ChatGPT答案如下：立体几何证明题里，坐标法能显著降低想象难度。两者都选择建立坐标系推进证明和距离计算，适合展示AI处理几何综合题的过程能力。第十六题：豆包和ChatGPT答案如下：这题把三角形边角关系和后续几何条件连在一起。两者都先用余弦定理处理基础量，再进入坐标化求解，整体策略比较稳。第十七题：豆包和ChatGPT答案如下：概率题最容易错在“停止规则”，尤其是最后一次投篮既可能投中，也可能一直未中。两者都能把边界情况纳入分布列，处理得比较细。第十八题：豆包和ChatGPT答案如下：椭圆题对计算量和几何关系都有要求，模型需要在方程、交点、面积条件之间来回切换。两者都给出了长链条推导，但压轴题仍建议人工复核关键代数步骤。第十九题：豆包和ChatGPT答案如下：最后一题更接近函数逻辑证明，重点不只是算出结果，还要把包含关系、单调性和条件推演讲清楚。AI能给出完整证明框架，但严谨性仍需要逐步检查。这次高考数学实测，真正说明了什么？把这轮实测放在一起看，一个变化很明显： AI做高考数学的讨论，已经从会不会算转向能不能稳定读题、拆条件、验步骤。选择题里，它要避免粗心；多选题里，它要逐项判断；填空题里，没有选项提示，最终答案必须自己算出来；到了大题，模型还要把证明过程讲清楚。这些能力叠在一起，才更接近真实的数学推理。这也解释了为什么同一个产品里，快速模式和思考模式会给人完全不同的感受。前者适合日常问答，追求快；后者面对复杂数学题时，会花更多时间展开推理、检查条件、组织步骤。拿快速模式去代表一个AI产品的复杂推理上限，结论很容易失真。当然，AI现在还不应该被当成永远正确的答案机。尤其是多选综合题、压轴解析几何、函数证明这类长链条任务，任何一步计算或条件理解出错，后面都可能一路错下去。更稳妥的用法，是把它当成一个高质量解题陪练：先帮你拆题，再帮你核对思路，最后提醒哪些步骤最容易出问题。从这个意

订阅66必读