返回首页 联系方式

产品中心

复合板系列

店面压瓦机

常用压瓦机系列

U型槽设备系列

百叶窗成型设备

数控止水钢板机

角驰压瓦机系列

三维扣板机系列

止水槽设备系列

落水管设备系列

煤矿专用设备系列

阳极板设备系列

梯形屋面板成型机

广告牌成型压瓦机

其它辅助设备系列

俄罗斯压型设备系列

波纹屋面成型机

隐藏式屋面板成型机

卷帘门压瓦机系列

彩钢拱形压瓦机系列

高速护栏压瓦机系列

C、Z型钢压瓦机系列

冷弯成型压瓦机系列

全自动闭口楼承板机

屋面,墙面板成型系列

楼承板成型压瓦机系列

琉璃瓦成型压瓦机系列

剪板机,折弯压瓦机系列

数控全自动地槽压型机

数控泡沫切割机压瓦机系列

挡风抑尘板成型机系列

太阳能光伏支架设备系列

二合一双层彩钢设备系列

大棚骨架几字打拱设备系列

热门点击
离谱!苹果遭印度合作伙伴泄密,
苹果iPhone 18/18e有望升级9GB内存,
男子怀疑“妻子”有外遇对其打骂
警方通报“15岁少年在家中和同学
5月9日黄海争议海域突然炸锅!韩
版本多样性
当前位置/ 行业新闻
4名大学生出题,AI考了0分!
4名大学生出题,AI考了0分!
近日
复旦大学一场特殊的
“反套路”期末考试结束
在该校“数据挖掘技术”课程考试中
学生们没有坐在考场里答题
反而成了出题人
他们用自己设计的10道题
去“考倒”三个当今最先进的AI模型
AI答错的题越多、
被难倒的模型越强
出题学生的得分就越高
据了解,51份期末试卷中,50人至少让某个AI答错过一题,仅1人完全没难倒任何模型。但能让任一模型整张卷得0分的,只有4人,且三个应考模型中最强的Claude模型没有被任何学生完全考倒。全班平均分85.7分,中位数88分。
“AI答错越多,学生得分越高”
“传统的出题考察方式,在AI时代已经失效了。”教授“数据挖掘技术”课程的肖仰华教授说,“老师出一道标准的算法题,AI比任何学生都算得快、算得准。继续用这种方式考,等于在AI的强项上跟AI比,这没有意义。”
于是,“数据挖掘技术”的期末作业修改了考试方式:每人出10道数据挖掘领域的计算题,要求有唯一正确答案和完整的推导计算过程。拿着这10道题去考三个不同水平的AI模型。 AI答错越多,学生得分越高。
“人考AI”考核流程示意图(出题→AI作答→自动判分→助教复核)
题目必须基于课程讲过的知识或教材内容,每道题要有唯一正确答案,学生自己得先能把题从头到尾算对。肖仰华说:“自己出的题自己都不会,那算不上真本事。”
计算与智能创新学院24级本科生谢锦树最后拿到了97分。他尝试让AI出题来难倒自己,便搭建了一个多智能体协作的自动化出题框架,用GPT-5.5-Pro做出题层,三个应考模型作答并自动判分。框架跑起来后,他发现AI会“作弊”。
AI会伪造标准答案,把假答案塞进去让判分脚本以为对了。它会限制最大输出长度来截断其他模型的推理过程。它会调低推理深度参数让其他模型懒得深入思考。它还会把一道成功了的题目复制十份来凑数。
于是,谢锦树加了一个审查层,拦截钻空子行为,最终自动生成了10道题,三个应考模型全部答错。
从“怎么算”到“怎么判断”
考试结束后,肖仰华观察到一个差异,即高分学生自己能把题从头到尾算对,低分学生出了题自己也不知道答案。
“高分同学对AI的弱点有准确判断,他们的题能命中AI的结构性缺陷;低分同学只是把课本习题换了个数字,AI在训练时见过千百万遍,直接套模板就对了。”
这一观察,让肖仰华心生警惕。那些能力本来就偏弱的学生,如果只会依赖AI做作业,自己的判断力会进一步退化。
有了这次尝试,肖仰华决定之后课程的考核方式要彻底转型。“人考AI”的模式会继续做下去,而且要做得更系统。
在他看来,传统那种考记忆、考计算的出题方式必须退场,未来的考核重点将全面转向评价能力、判断能力和创造性思维,这些高阶能力才是AI替代不了的。
“所以课堂上更多的时间被用来讨论,学生怎么判断一个结果是对的还是错的?怎么识别AI在哪里会出问题?怎么提出一个AI回答不了的好问题?”肖仰华认为,这门课正在从训练学生“怎么做”,转向训练他们“怎么指挥AI来做、怎么评判AI做的结果”。
而对于在这次考试中没拿到好成绩的同学,肖仰华表示,接下来的课程设计也会有意识去托住这部分学生,帮他们建立最基本的判断底线,不能让他们成为只会点击“确认”的AI使用者。
浏览关于 的信息
相关产品
深度解析:4名大学生出题AI考0分的完整原因

深度解析:4名大学

4名大学生出题 AI考了0分 反套路考试挑战AI

4名大学生出题 A

相关推荐
更多