泡泡资讯网

AI 搞科研真有那么神? 耶鲁大学和芝加哥大学发表了一篇极为硬核的论文,直击大

AI 搞科研真有那么神?

耶鲁大学和芝加哥大学发表了一篇极为硬核的论文,直击大模型科研创新的痛点。

研究人员用了个绝妙的控制变量法:他们翻箱倒柜找来 11683 篇 真正的顶级人类论文,把这些论文背后的“前人文献(prior work)”作为相同的起跑线喂给 AI。然后让大模型和人类科学家同台竞技,针对同样的背景提出新的研究动机和方法。

结果发现,AI 的“质量”没问题,听起来都挺像那么回事。但最大的硬伤是——思路太狭隘了,大模型简直就是个“缝合怪”发烧友!

统计数据里的“高级缝合”。

研究人员将两者的点子进行了多维度拆解。结果令人哭笑不得:

人类科学家的点子:堪称“百花齐放”,有人去解释深层机制,有人热衷于测试失败案例,有人在测算数据,有人在哼哧哼哧硬核搭系统、提效率。其中,只有 12.1% 的人类想法是单纯去“连接两个不相关的现有工作(缝合)”。

大模型的点子:直接化身“连接大师”。47.1% 到 64.2% 的 LLM 点子都在玩“A+B”的缝合套路,高出人类 4 到 5 倍!

更扎心的是,你以为给大模型加了像 O1 那样的“草稿纸机制(Reasoning)”,或者疯狂卷 Prompt、拉长思考时间,它就能突破自我?

事实恰恰相反,思维链越长,它在“缝合”这条路上走得越坚定! 更多的算力只是让它把这个老掉牙的“缝合配方”打磨得更精致、更具欺骗性,而不是去探索更宽广的科研范式。

为什么 AI 逃不出“套路”?

这其实暴露了当前大模型基于概率预测的底层硬伤。

AI 本质上在寻找“高概率的连接”:哪怕它学完了全网的数据,它的底层逻辑依然是“在统计学上寻找相关性”。在海量文献中,把 A 领域的概念引入 B 领域,是统计学上最安全、最容易显得“合理”的生成路径。

缺乏“真正的痛觉”:

人类去测试失败案例(Testing Failures)或者重构系统,往往是因为在现实实验室里被某些恶心人的 Bug 破防过、破产过,有真正的痛点。

而关在服务器里的 AI 并没有真正的“工程实践痛感”,它只能在文字游戏里玩排列组合。

这就像是你让它去搞发明,人类可能会去造个火箭,或者去研究为什么自行车会爆胎;而 AI 默默看了一眼现有的工具箱,决定把螺丝刀和手电筒绑在一起,并自豪地称之为“智能光感旋凿系统”。

评论列表

山水路桥
山水路桥 2
2026-07-05 13:28
人类本身也是在语言里找相关性。