AI 搞科研真有那么神？耶鲁大学和芝加哥大学发表了一篇极为硬核的论文，直击大

AI 搞科研真有那么神？

耶鲁大学和芝加哥大学发表了一篇极为硬核的论文，直击大模型科研创新的痛点。

研究人员用了个绝妙的控制变量法：他们翻箱倒柜找来 11683 篇真正的顶级人类论文，把这些论文背后的“前人文献（prior work）”作为相同的起跑线喂给 AI。然后让大模型和人类科学家同台竞技，针对同样的背景提出新的研究动机和方法。

结果发现，AI 的“质量”没问题，听起来都挺像那么回事。但最大的硬伤是——思路太狭隘了，大模型简直就是个“缝合怪”发烧友！

统计数据里的“高级缝合”。

研究人员将两者的点子进行了多维度拆解。结果令人哭笑不得：

人类科学家的点子：堪称“百花齐放”，有人去解释深层机制，有人热衷于测试失败案例，有人在测算数据，有人在哼哧哼哧硬核搭系统、提效率。其中，只有 12.1% 的人类想法是单纯去“连接两个不相关的现有工作（缝合）”。

大模型的点子：直接化身“连接大师”。47.1% 到 64.2% 的 LLM 点子都在玩“A+B”的缝合套路，高出人类 4 到 5 倍！

更扎心的是，你以为给大模型加了像 O1 那样的“草稿纸机制（Reasoning）”，或者疯狂卷 Prompt、拉长思考时间，它就能突破自我？

事实恰恰相反，思维链越长，它在“缝合”这条路上走得越坚定！更多的算力只是让它把这个老掉牙的“缝合配方”打磨得更精致、更具欺骗性，而不是去探索更宽广的科研范式。

为什么 AI 逃不出“套路”？

这其实暴露了当前大模型基于概率预测的底层硬伤。

AI 本质上在寻找“高概率的连接”：哪怕它学完了全网的数据，它的底层逻辑依然是“在统计学上寻找相关性”。在海量文献中，把 A 领域的概念引入 B 领域，是统计学上最安全、最容易显得“合理”的生成路径。

缺乏“真正的痛觉”：

人类去测试失败案例（Testing Failures）或者重构系统，往往是因为在现实实验室里被某些恶心人的 Bug 破防过、破产过，有真正的痛点。

而关在服务器里的 AI 并没有真正的“工程实践痛感”，它只能在文字游戏里玩排列组合。

这就像是你让它去搞发明，人类可能会去造个火箭，或者去研究为什么自行车会爆胎；而 AI 默默看了一眼现有的工具箱，决定把螺丝刀和手电筒绑在一起，并自豪地称之为“智能光感旋凿系统”。

泡泡资讯网

AI 搞科研真有那么神？耶鲁大学和芝加哥大学发表了一篇极为硬核的论文，直击大

评论列表

热门分类

AI 搞科研真有那么神？ 耶鲁大学和芝加哥大学发表了一篇极为硬核的论文，直击大

评论列表

猜你喜欢

这不怪AI。这场面太震撼了…

近日据TheInformation爆料，Meta内部新规，限制AI工程师使用C

物理AI产业链简析物理AI是大模型从纯虚拟算力走向实体落地的关键方向，整条产业链

不懂就问，这个是AI吗？

Anthropic创始人最近的言论：AI开源是伪命题。他说，AI模型就算

喊话“AI的尽头是电力”那些人哪里去了？看清中国电力本质才不会被舆论误导。在

所有人盯着AI的时候，A股最安静的板块，大多数人的注意力，还停留在AI，算力，机

热门分类

AI 搞科研真有那么神？耶鲁大学和芝加哥大学发表了一篇极为硬核的论文，直击大