很多人还没意识到,就在咱们盯着各种聊天机器人斗法的时候,底层的“芯片战争”已经打到了刺刀见红的地步。
一边是全球最大的芯片卖家英伟达,豪掷200亿美金强行吞下推理芯片公司Groq;另一边则是全球最大的算力买家OpenAI,同样砸出200亿采购Cerebras的硬件,甚至还悄悄拿到了对方的股权。
这绝不是两桩简单的买卖,而是一场关乎未来十年科技命脉控制权的“生死博弈”。
为什么大佬们突然在2026年集体“发疯”?因为大家终于回过神来了:AI的战场重心,已经从“训练”彻底转向了“推理”。
打个通俗的比方,训练就像是培养一个大学生,而推理就是让他去上班干活,2023年大家都在比谁的学生更聪明,但到了2026年,大家比的是谁家雇的员工干活更省钱、速度更快。
要知道,训练是一次性的投入,而推理则是每天都在跳动的真金白银。
根据2026年最新的行业数据,推理支出已经占到了整个算力市场的整整三分之二,用联想CEO杨元庆的话说,以前是八成经费搞研发,现在是八成经费付“房租”。
这时候,英伟达这位曾经的“武林盟主”突然发现,自己引以为傲的H100、H200芯片,竟然在推理环节遇到了天大的麻烦。
这就像是一个力大无穷的壮汉,搬重物(大矩阵计算)是一把好手,但如果让他去送外卖(高频低延迟响应),他那庞大的身躯反而成了累赘。
H100用的是外接HBM内存,数据搬运的距离太长,这就导致用户问ChatGPT一个问题,芯片在内部“运送答案”的时间,甚至比计算时间还要长。
这种架构上的天然缺陷,让英伟达在面对每秒千万级的用户请求时,显得有些力不从心。
就在这时,像Cerebras这种“异类”杀出来了,他们搞出了像手掌一样大的WSE-3芯片,把90万个核心和超大内存直接焊在一起。
这种“内存贴脸”的设计,让推理速度直接比英伟达快了15到20倍,这简直就是降维打击。
于是,英伟达坐不住了,那笔200亿美金的收购案,本质上就是一张昂贵的“认错书”。
花这么多钱买Groq,其实就是变相承认:光靠GPU这套老架构,真的堵不住推理市场的这个大窟窿了。
既然自己生不出这样的“儿子”,那就只能花天价去外面抱一个回来,以此来防守自己的王座。
奥特曼不傻,他不想永远给黄仁勋打工,更不想让OpenAI的命运掐在别人的产能里。
他给Cerebras砸200亿,不仅是买芯片,更是通过认股权证把对方变成了自己的“准子公司”,这分明是在秘密修筑一条不经过英伟达地界的算力高速公路。
就在4月17日,Cerebras正式提交了IPO申请,估值直接喊到了350亿美金,比去年翻了四倍还多。
虽然外界还在质疑它的客户过于集中,但有OpenAI这个超级大腿在后面撑着,这桩IPO几乎成了2026年资本市场最肥的肉。
说白了,英伟达砸200亿是在“防守”,想保住旧时代的江山;而OpenAI砸200亿是在“破局”,想建立新时代的秩序。
当算力不再是瓶颈,当推理成本低到可以忽略不计,AI真正改变世界的临界点才会真正到来。
这场两大巨头的豪赌,最后谁能笑到最后?是守住江山的黄教主,还是想逆天改命的奥特曼?



