返回首页 联系方式

产品中心

复合板系列

店面压瓦机

常用压瓦机系列

U型槽设备系列

百叶窗成型设备

数控止水钢板机

角驰压瓦机系列

三维扣板机系列

止水槽设备系列

落水管设备系列

煤矿专用设备系列

阳极板设备系列

梯形屋面板成型机

广告牌成型压瓦机

其它辅助设备系列

俄罗斯压型设备系列

波纹屋面成型机

隐藏式屋面板成型机

卷帘门压瓦机系列

彩钢拱形压瓦机系列

高速护栏压瓦机系列

C、Z型钢压瓦机系列

冷弯成型压瓦机系列

全自动闭口楼承板机

屋面,墙面板成型系列

楼承板成型压瓦机系列

琉璃瓦成型压瓦机系列

剪板机,折弯压瓦机系列

数控全自动地槽压型机

数控泡沫切割机压瓦机系列

挡风抑尘板成型机系列

太阳能光伏支架设备系列

二合一双层彩钢设备系列

大棚骨架几字打拱设备系列

热门点击
离谱!苹果遭印度合作伙伴泄密,
苹果iPhone 18/18e有望升级9GB内存,
男子怀疑“妻子”有外遇对其打骂
警方通报“15岁少年在家中和同学
5月9日黄海争议海域突然炸锅!韩
版本多样性
当前位置/ 行业新闻
深度解析:4名大学生出题AI考0分的完整原因
深度解析:4名大学生出题AI考0分的完整原因
近日复旦大学创新期末考核中,4名大学生成功出题让主流大模型完整答卷得0分,这件事直观暴露了当前大模型的核心短板,也为AI时代的高校教育改革提供了新方向。
 
  一、事件背景
 
  这是复旦大学肖仰华教授《数据挖掘技术》的创新期末考核,规则完全反传统:
 
51名学生每人出10道数据挖掘计算题,必须有唯一标准答案、完整推导,出题人自己要能完整算出正确结果;
用三套主流大模型(GPT、Claude、DeepSeek)分别作答学生试卷,AI答错越多,出题学生得分越高;
全班仅4名学生做到:某一款AI做完整套10题全部答错、拿0分;最强Claude无任何人能考到0分,班级平均分85.7分。
  二、明明支持联网搜索,AI依旧考0分四大核心原因
 
  1. 题目是学生原创定制,全网无现成标准答案(最关键)
 
学生题目基于课程推导、自定义参数、多步骤复合计算,属于原创组合题型,互联网、论文、题库里不存在一模一样的完整解题步骤;
联网只能搜到通用基础公式,搜不到这道题专属的中间演算逻辑,AI无法直接抄答案。
  2. 大模型天生短板:长链条多步数值推理极易连锁出错
 
  数据挖掘计算题需要十几步连续矩阵、概率、迭代运算:
 
AI单一步骤计算正确率尚可,但多步推导极易算错中间值;一步数值出错,后续全部推导全部崩盘,哪怕联网查到公式,代入数值依然算错;
联网搜索只能提供理论公式,不能替代AI高精度连续数值运算。
  3. AI幻觉:只会生成通顺文字,不会自主核验计算对错
 
  大语言模型本质是文字概率预测,不具备人类“验算”思维:
 
联网查到资料后,AI会强行拼凑看似专业的步骤,不会交叉核对数值;
发现逻辑矛盾时,不会承认算错,反而编造错误推导自圆其说;
遇到小众定制题型,直接伪造计算过程、虚假结论,出现“一本正经答错全部题目”。
  4. 学生精准命中AI盲区,刻意规避网络现成题库
 
 
  高分出题学生专门针对AI弱点设计题目:
 
避开教材、网上习题原题,打乱参数、融合多个知识点;
设置多层嵌套迭代、小众模型自定义约束,网上没有完整例题;
部分题目加入隐藏校验条件,AI联网查到基础方法,但忽略隐藏限制,全程答偏。
  三、这件事带来两层关键启示
 
  1. 对学生:AI不是万能工具,深度思考无法被替代
 
简单背诵、套模板题目AI能满分,但原创、多步骤逻辑推导、自定义复合计算是AI弱项;
能设计出让AI全军覆没考题的学生,代表真正吃透底层原理,而非只会搜题套公式。
  2. 对高校教育:传统刷题考试已经失效
 
  肖仰华教授改革初衷:常规标准化习题AI秒解,区分不出学生真实水平;改用“学生出题考AI”,考核重点从“做题能力”转向知识拆解、识别AI缺陷、深度理解专业底层逻辑,适配AI时代新评价标准。
 
  四、补充:联网搜索为什么救不了AI?
 
  联网仅能完成事实类、单公式、现成例题查询,无法解决两类核心难点:
 
定制化连续数值演算:网络没有对应完整演算过程,AI自身计算误差无法靠搜索弥补;
多层逻辑约束推理:网上只有单一知识点,没有多知识点融合题型的完整解题链路。
  简单总结:联网只能给AI提供“工具书”,但复杂数学推导、原创复合计算题,依旧需要自主逻辑运算,这是当前大模型难以弥补的短板,也是4名学生能让AI整张试卷拿0分的核心逻辑。
浏览关于 的信息
相关产品
4名大学生出题,AI考了0分!

4名大学生出题,

4名大学生出题 AI考了0分 反套路考试挑战AI

4名大学生出题 A

相关推荐
更多