首页 > 科技未来 > 内容

ChatGPT已通过顶尖大学的考试，除了对抗AI，我们更应该做的是改变考试题目

发布于：2024-06-21 编辑：匿名来源：网络

??当法学院学生尝试新事物玩ChatGPT时，他们可能没想到它会转身和他们一起参加同样的考试。

“ 同学”。

在刚刚过去的一月份，明尼苏达大学法学院的 Jon Choi 教授和宾夕法尼亚大学沃顿商学院的 Christian Terwiesch 教授分别要求 ChatGPT 为他们的课程“做”期末考试题。

结果，ChatGPT真的通过了！这是否意味着让ChatGPT进化得更久一点，我们就不再需要人类律师和管理者了？或者这是对教育者的警钟，让他停止教导人类像人工智能一样？通过考验的背后：老师“放手”，排名全班垫底。

他选修的两个专业中，ChatGPT在法学院的成绩比商学院的成绩要差。

前者的平均成绩为C+，后者则可以达到B-到B的成绩。

具体来说，ChatGPT在沃顿完成的是MBA（工商管理硕士）“运营管理”科目的测试题，每道题都需要一个“推演过程”。

测试过程中，Terwiesch 教授将原始测试问题输入 ChatGPT，并对 ChatGPT 生成的答案进行评分。

总的来说，ChatGPT 在回答基本分析问题时表现非常好；数学不太好，可能会突然算错一道小学水平的算术；而对于相对复杂的分析题，ChatGPT基本没什么用处。

例如，第一题测试对“管理瓶颈”概念的理解，简单比较“生产流程”中哪一步效率最低，从而找到“瓶颈”。

教授给了这个问题全A+。

然而，当试题中的“生产流程”变得更加复杂，需要加工的原材料不只一种，且涉及的设备各不相同且重叠时，ChatGPT就不能再被认为是“管理瓶颈”。

”对于这道题，虽然ChatGPT的推演过程是错误的，但却“完美绕过”了错误的推论，命中了答案。

在计算“接收站”的效率时，ChatGPT 的结果是“桶/小时”。

虽然这个数字是错误的，但从这个数字来看，它确实是分析过程中效率最低的环节。

谁能想到ChatGPT“不相信自己”，并没有选择这个环节作为“瓶颈”。

相反，它选择了计算效率为“桶/小时”的“干燥器”环节作为“瓶颈”——选择正确答案。

不过，Terwiesch·教授虽然最终给ChatGPT打了B级，但他也有点“昏昏欲睡”。

当ChatGPT的答案出现错误时，Terwiesch会给ChatGPT提供有针对性的提醒，然后让它再次输出答案，并用这个“优化”的结果来评分。

至于法学院考试，ChatGPT 为宪法法、雇员福利法、税法和侵权法这四门课程创建了期末考试题。

主导测试的Jon Choi 教授表示，在“盲改”的情况下，ChatGPT通过了全部四科，但成绩基本处于全班垫底。

虽然ChatGPT的简答题比选择题要好，但简答题的答案质量极不稳定——有时答案可能比一般学生好（大多是口述法律条文和背诵案例），但一旦他们做出错误（通常是要求学生运用具体理论分析案例的题目），分数常常“错到新低”：ChatGPT 在法学院考试的最基本问题上表现不佳，例如识别潜在的法律问题和in-深入案例分析和法律条文运用，ChatGPT“不求理解，只求背书”的答题方式却能以低分通过专业考试，这在一定程度上说明了考试题目仍然过于依赖“死记硬背”的表现。

无法取代律师和管理者，但是，如果人类学生是同等水平，通过考试，甚至毕业后进入执业，那不是更成问题吗？ ChatGPT能否强行改变被诟病多年的“背书就够了”的考试？在ChatGPT惊艳亮相之前，卡内基梅隆大学的教授·丹尼·奥本海默就已经发问：在谷歌搜索时代，为什么大学考试只注重学生对事实的重述？奥本海默指出，虽然有些教育者会反驳说，他们在课堂上解释事实信息时，也会分析这些信息的含义、论据和应用，但到了试卷上，立刻就变成了“背书”：很多课程都是建立在这样的前提上的：学生通过观察老师的榜样来分析、扩展和应用事实，学生自然会发展出这套技能——这是一个非常值得怀疑的假设。

。

因此，奥本海默建议课程设置应该直接反映教育者希望学生最终学到的技能。

还需要融入新技术，例如“计算机辅助文学欣赏”和“如何与不同意你的人进行文明沟通”。

考试可以包含事实信息，但应注重学生的分析和应用能力。

此外，要求学生“排练”他们将来会遇到的场景也是练习技能的直接方式，例如询问学生研究气候变化，为公众策划与气候相关的展览。

现在到了ChatGPT时代，这种改变自然更加迫切，因为它比搜索引擎更加高效，同时也更加混乱。

除了节省学生翻阅搜索结果页面的时间外，ChatGPT 还可以生成具有足够语言结构能力的流畅段落，即使事实准确性非常值得怀疑。

有趣的是，ChatGPT 也像一面镜子。

一方面，它让我想起应试教育中的作文和简答题，总是显得像是无休无止的“模仿”，填充着一个标准范式，就像ChatGPT一样。

另一方面，通过“吃”大数据和通过真实的人类反馈进行“培训/教育”，ChatGPT的“严重废话”内容也与我们遇到的日常生活非常相似。

以至于沃顿商学院的Terwiesch·教授大喜过望，觉得ChatGPT可以为未来的管理者带来极好的学习材料——商界已经充满了严肃的废话，就像ChatGPT所说的那样。

，商学院的学生可以用它来做鉴别练习！你我都知道商学院的学生并不是唯一需要学习这项技能的人。

然而，自搜索引擎普及以来，美国高等教育界一直存在关于改革的讨论，但时至今日进展仍然有限。

ChatGPT的诞生能否迫使它跑得更快？我们只能继续观察。

人性，像人一样，我一直认为，每当人类试图“重新发明”某样东西时，总是暴露出我们对事物理解的局限性，同时也帮助我们了解自己。

当试图在太空“重建”食物时，研究人员发现食物确实不能仅仅减少到“营养充足”。

维持人在空间中的身心健康，色、香、味、声都影响感知。

环境一定要小心，一起吃饭的人也很重要。

当我们拥有一个可以“流利地说人类语言”的ChatGPT时，人们也开始发现人类语言不仅仅是“文字”。

一个仅接受语言材料训练的系统永远无法接近人类智能，即使它现在就开始训练并训练到宇宙毁灭。

研究人工智能哲学的雅各布·布朗宁（Jacob Browning）和图灵奖得主Yann Le Cun在一篇联合文章中指出。

他们认为，文本作为一种高度浓缩的抽象符号，能够被人类理解，是因为我们拥有丰富的非语言共识和个人经验。

这也意味着言语总是容易产生误解和歧义。

ChatGPT已通过顶尖大学的考试，除了对抗AI，我们更应该做的是改变考试题目

语言是我们交流的工具，但教育者对学生的理解和评价不应该局限于论文。

使用先进的大规模语言模型表明我们仅从语言中获得的信息是多么有限。

站长声明

标签：

上一篇：扎克伯格的“自拍”遭到群众嘲笑，这就是烧了几百亿美元的元宇宙吗？

下一篇：小鹏 P7i 抢先体验：这辆新车，抚平了 P7 车主所有的痛

一级市场并购退出的难点是什么？

自2019年港股、美股IPO退出受阻以来，创业者和投资者开始意识到IPO退出是一座相对被动的独木桥，并购退出开始受到关注。今年年中，A股IPO退出因政策调整持续收紧，并购退出关注度再度升级。诚然，过去二十年中国私募股权市场一直以IPO退出为主，而并购退出一直尤为小众。然

06-18
IC分销商：8英寸产能紧张明年Q1将继续推高芯片价格

据IC分销商人士透露，由于8英寸晶圆代工产能持续紧张，电源管理IC、网络芯片、供应商的工业和汽车MCU今年第一季度仍有能力提价。据digitimes报道，随着疫情期间全球企业数字化转型需求增加，以及多个主要国家积极推动碳减排，一线制造商、品牌供应商、金融机构正在实施ESG管

06-08
吉利汽车与大搜车达成战略合作，打造全国首个汽车直销数字化新零售网络

5月18日，吉利汽车与大搜车宣布战略合作，共同打造全国首个数字化“实直销、定点”在汽车直销新零售网络中，双方合作的首款直销车型——缤越PRO轻骑BSG版，在大搜车旗下汽车新零售平台当个车上独家推出，固定价格全国0元价。大搜车创始人兼CEO姚军红（左）与吉利汽车集团副总

06-17
普洛斯在日本和欧洲的两只物流收益基金已完成新一轮募资

投资界（ID：pedaily）1月15日消息。近日，普洛斯在日本和欧洲的两只物流收益基金完成了新一轮募资。筹集的资金为“GLP日本收入基金”（GLP JIF）和“GLP欧洲收入基金II”（GLP EIP II）。过去12个月，普洛斯全球物流行业基金管理的资产增加了近1亿美元。 GLP JIF是日本最

06-18
专注钢铁数字供应链服务，兰格获近亿元A轮融资

投资社区（ID：pedaily）11月30日消息，据创业网消息，钢铁数字供应链服务平台“兰格”宣布据了解，其已完成奇富资本独家投资的近亿元A轮融资。据悉，本轮融资将主要用于拓展外部区域市场，以及平台智能化、数字化的迭代升级。据了解，兰格成立于2017年，专注服务钢铁行业2

06-18
恒大已安排136亿港元自有资金提前偿还美元债本息

据6月24日消息，今日，中国恒大发布公告称，已安排约136亿港元自有资金偿还美元债本息。 1亿港元转入债券偿还账户，用于偿还本年度债券偿还账户。 6月28日到期的14.5亿美元债券以及全部到期境外美元债到期应付利息近3亿美元，合计约17.5亿美元。至此，恒大今年3月之前将无境

06-17
B2B医药营销平台“药师帮”完成新一轮融资2.7亿美元

B2B医药营销平台“药师帮”近日完成新一轮融资2.7亿美元。本轮融资参与方包括珠江投资、百度、阳光保险、松鹤资本、广州基金及某国家主权基金等。本轮融资将主要用于合同履约各环节的技术升级、药企院外市场数字化营销系统的迭代与建设、药店专业服务场景的数据共享平台建设

06-18
重庆200亿资金来了

重庆越来越热闹了。投资界-Decode LP获悉，近日，重庆两江新区国有企业共同投资设立高质量发展产业投资基金，总金额1亿元，重点关注重点行业技术创新引导投资和重大项目，推动新区乃至重庆产业高质量发展。据悉，本次母基金总规模1亿元，投资采取“母基金+重大项目直投+专项

06-18
诞生125年后，圆形方向盘即将变成方形？

前段时间，丰田公布了bZ纯电动专属系列首款车型bZ4X的详细信息。新车定位中型纯电动SUV，车身尺寸与RAV4类似。新车的外观我大致了解了一下。它与8个月前上海车展上展示的概念车没有什么不同。虽然值得肯定，但也在情理之中。真正让我惊讶的是方向盘——它采用了异形方向

06-21
特殊材料替代硅制造半导体薄膜

据美国《每日科学》网站9日报道，美国麻省理工学院（MIT）的工程师近日研发出一项新技术。他们用一批特殊材料代替硅，制造出超薄半导体薄膜。新技术为科学家提供了制造柔性电子器件的低成本解决方案，所得电子器件的性能将优于现有硅基器件，有望在未来智慧城市中“大展拳脚

06-06
2020年我不再开店了

粥店被房东拿走后，王叶松了一口气。 “店铺转让”已经发布近一个月了，却没有人关注。疫情虽然散去，但线下业务依然没有起色。王叶没有承担每月高昂的费用，最终无奈选择及时止损，直接取消租约。此前，他和他的网红粥店已经苦苦挣扎了三个月。下半年，带着上次“网红煎

06-17
比亚迪：子公司拟出资3亿美元参与投资基金

据10月8日消息，比亚迪宣布，旗下子公司Golden Link拟出资3亿美元参与投资基金Community Fund LP。预计募资规模不超过6亿美元，主要投资科技、医疗创新等领域的优秀子基金。

06-17