很多人还没意识到，就在咱们盯着各种聊天机器人斗法的时候，底层的“芯片战争”已经打

很多人还没意识到，就在咱们盯着各种聊天机器人斗法的时候，底层的“芯片战争”已经打到了刺刀见红的地步。

一边是全球最大的芯片卖家英伟达，豪掷200亿美金强行吞下推理芯片公司Groq；另一边则是全球最大的算力买家OpenAI，同样砸出200亿采购Cerebras的硬件，甚至还悄悄拿到了对方的股权。

这绝不是两桩简单的买卖，而是一场关乎未来十年科技命脉控制权的“生死博弈”。

为什么大佬们突然在2026年集体“发疯”？因为大家终于回过神来了：AI的战场重心，已经从“训练”彻底转向了“推理”。

打个通俗的比方，训练就像是培养一个大学生，而推理就是让他去上班干活，2023年大家都在比谁的学生更聪明，但到了2026年，大家比的是谁家雇的员工干活更省钱、速度更快。

要知道，训练是一次性的投入，而推理则是每天都在跳动的真金白银。

根据2026年最新的行业数据，推理支出已经占到了整个算力市场的整整三分之二，用联想CEO杨元庆的话说，以前是八成经费搞研发，现在是八成经费付“房租”。

这时候，英伟达这位曾经的“武林盟主”突然发现，自己引以为傲的H100、H200芯片，竟然在推理环节遇到了天大的麻烦。

这就像是一个力大无穷的壮汉，搬重物（大矩阵计算）是一把好手，但如果让他去送外卖（高频低延迟响应），他那庞大的身躯反而成了累赘。

H100用的是外接HBM内存，数据搬运的距离太长，这就导致用户问ChatGPT一个问题，芯片在内部“运送答案”的时间，甚至比计算时间还要长。

这种架构上的天然缺陷，让英伟达在面对每秒千万级的用户请求时，显得有些力不从心。

就在这时，像Cerebras这种“异类”杀出来了，他们搞出了像手掌一样大的WSE-3芯片，把90万个核心和超大内存直接焊在一起。

这种“内存贴脸”的设计，让推理速度直接比英伟达快了15到20倍，这简直就是降维打击。

于是，英伟达坐不住了，那笔200亿美金的收购案，本质上就是一张昂贵的“认错书”。

花这么多钱买Groq，其实就是变相承认：光靠GPU这套老架构，真的堵不住推理市场的这个大窟窿了。

既然自己生不出这样的“儿子”，那就只能花天价去外面抱一个回来，以此来防守自己的王座。

奥特曼不傻，他不想永远给黄仁勋打工，更不想让OpenAI的命运掐在别人的产能里。

他给Cerebras砸200亿，不仅是买芯片，更是通过认股权证把对方变成了自己的“准子公司”，这分明是在秘密修筑一条不经过英伟达地界的算力高速公路。

就在4月17日，Cerebras正式提交了IPO申请，估值直接喊到了350亿美金，比去年翻了四倍还多。

虽然外界还在质疑它的客户过于集中，但有OpenAI这个超级大腿在后面撑着，这桩IPO几乎成了2026年资本市场最肥的肉。

说白了，英伟达砸200亿是在“防守”，想保住旧时代的江山；而OpenAI砸200亿是在“破局”，想建立新时代的秩序。

当算力不再是瓶颈，当推理成本低到可以忽略不计，AI真正改变世界的临界点才会真正到来。

这场两大巨头的豪赌，最后谁能笑到最后？是守住江山的黄教主，还是想逆天改命的奥特曼？

泡泡资讯网

很多人还没意识到，就在咱们盯着各种聊天机器人斗法的时候，底层的“芯片战争”已经打

热门分类