如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-20 20:40:15
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-20 13:55:17如何看待M4单核性能吊打9950x?
- 2025-06-20 14:10:18脸与身材不符是种怎样的体验?
- 2025-06-20 15:20:18你见过身边身材最好的女生是什么样子的?
- 2025-06-20 15:05:17女生被踢裆也会很疼吗?
- 2025-06-20 15:20:18你们认为一个40多岁的女人老吗?
- 2025-06-20 13:45:16如何看待 2026QS 世界大学排名?
- 2025-06-20 15:00:18胸大的女孩子有什么烦恼?
- 2025-06-20 14:05:19广东怀集遇历史最大洪水,约 30 万人受灾,积水最深处达 3 米,目前当地情况如何?
- 2025-06-20 15:05:17请各位参与了鸿蒙NEXT APP适配的开发者来谈一谈适配过程中的感受?
- 2025-06-20 14:50:17如何评价中国电科研发的JY-10防空指挥控制系统成为伊朗防空指挥系统核心?
推荐产品
-
异性同办公室久了会不会日久生情?
我最近一年,因为有个项目,经常和一个女同事出差,我是产品,她 -
在山上挖一座不放鱼的池塘,再过100年时间,里面会慢慢有鱼吗?
如果条件合适,不说出现鱼了,它可以演变成一个完美的自然生态系 -
京东刘强东近期小范围分享怎么看?
文 | 佘宗明时间点,正确——不是寻常时点,是6·18收官日 -
公务员单位为什么不用指纹打卡机并且严格考勤制度?
这是我同学单位多年前的一件真事。 某区法院新来了一位年轻的
最新资讯