泡泡资讯网

国外一个研究团队做了严肃实验，让 GLM-5.2 和 Opus 4.8 跑同一个

2026-06-27 00:49:36 黑科技不太浅科技

国外一个研究团队做了严肃实验，让 GLM-5.2 和 Opus 4.8 跑同一个极难的科学任务。您猜怎么着？

他俩都成功了，但花费的钱可不一样多。

简单来说，这个任务就是要复现一个论文上的科学结论。模型必须自己找到解决问题的方法，然后自己运行实验论证论文的结论。

以下是团队的三个结论：

1）GLM 5.2 花费 6.21 美元，而 Opus 4.8 花费我们 46.35 美元

2）两个模型都花费了大部分 token 来解决初始 verl 问题。GLM 5.2 在首次成功前尝试了 14 次失败运行，而 Opus 4.8 尝试了 9 次运行。

3）GLM 5.2 令人惊讶地使用了 265 万个 token，而 Opus 4.8 使用了 453 万个 token。

阅读：72 点赞：0

猜你喜欢

与其说她疯了，我宁愿相信她能看见鬼魂😭《莫离》这把刀子藏得太深了，明明那样明媚

与其说她疯了，我宁愿相信她能看见鬼魂😭《莫离》这把刀子藏得太深了，明明那样明媚

2026-06-25 路边的野花多采

标签：莫离夏目友人帐叶璃

最近，Snowflake的CEO公布了他们对国产模型和海外模型的终极测试结果

最近，Snowflake的CEO公布了他们对国产模型和海外模型的终极测试结果

2026-06-25 黑科技不太浅

标签： ai 终极测试

岚海智能超混很强，下午岚图泰山在路上电量5%发动机启动后，继续跑了二十多公里，这

岚海智能超混很强，下午岚图泰山在路上电量5%发动机启动后，继续跑了二十多公里，这

2026-06-26 不发看车

标签：泰山

发表SCI论文400多篇，这个印度牛人作为人才被引进到浙江农林大学计算机

发表SCI论文400多篇，这个印度牛人作为人才被引进到浙江农林大学计算机

2026-06-22 快乐卖鱼老头

标签：浙江农林大学论文大学

最近GLM5.2有点DeepSeek2.0的意思了发布的时间点是6月13日

最近GLM5.2有点DeepSeek2.0的意思了发布的时间点是6月13日

2026-06-22 烨华聊商业

标签： deepseek ai

不小心拍到了导师那里的请假记录

不小心拍到了导师那里的请假记录

2026-06-26 万物图幽默

标签：论文导师疫苗

分享图片

2026-06-26 思山深聊娱乐

一位X上的国外设计师给GLM5.2和Claude布置了相同的设计任务，

一位X上的国外设计师给GLM5.2和Claude布置了相同的设计任务，

2026-06-22 黑科技不太浅

标签： openai 设计师