梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔了颗惊雷。而是他们居然又 开发了新的模型!1月21日外媒曝光,梁文锋在DeepSeek发布推理模型R1一周年之际,新模型“MODEL1”的项目名在开源社区悄然出现。 这波操作真不是碰巧,明眼人一看就知道是 DeepSeek 早就算计好的。 毕竟 R1 去年刚亮相就搅得 AI 圈天翻地覆,性能能跟国际顶尖模型硬碰硬,训练成本却只有别人的二十分之一,推理起来每百万 token 才花 1 块钱,开源之后全球开发者都抢着用,光 Hugging Face 上的下载量就破了 1090 万次。 现在趁着周年庆的热度放出新模型,既蹭了老产品的流量,又能给行业再来一记重拳,这布局确实够深。 梁文锋这人向来不爱搞虚的,R1 发布的时候就没办什么铺张的发布会,连他自己都很少露面,要不是当时受邀参加国务院座谈会上了新闻,很多人都不知道这位创始人长啥样。 这次 MODEL1 更低调,直接在开源社区悄悄露头,没提前放半点风声,等外媒曝光了才让大家后知后觉。这种闷声干大事的风格,跟 AI 圈里那些爱造势的厂商比起来,确实显得格外特别。 现在开源模型早就不是配角了,全球开源模型数量一年能涨 115%,中国的开源项目在全球应用占比都到 63% 了,跟闭源模型的性能差距也缩小到 1.7%。 DeepSeek 显然早就看清了这个趋势,R1 开源之后不仅圈了大批开发者,还带动了整个行业的开源热潮,不少企业都跟着推出了自己的开源模型。 这次 MODEL1 选在这个时候出现,明显是想在开源赛道上再添一把火,巩固自己的位置。 开源社区里现在已经炸开了锅,不少开发者开始扒 MODEL1 的蛛丝马迹,发现早就有相关的代码提交记录,只是一直没公开。 大家都在猜这新模型能带来啥惊喜,毕竟 R1 在数学推理、代码编写这些硬指标上已经够能打了,MODEL1 要是能在这个基础上再升级,说不定又能刷新行业认知。 而且 DeepSeek 之前在工具链上也有过突破,他们的开源工具在特定精度下的效率比英伟达的算子库还高 2.7 倍,这次新模型说不定也藏着类似的黑科技。 要知道现在 AI 圈卷得厉害,各大厂商都在憋大招,要么拼算力堆料,要么抢场景落地。但梁文锋偏不按常理出牌,一直强调算法创新才是核心,还说中国 AI 不用弯道超车,要开辟自己的赛道。 从幻方量化时期就开始攒算力、磨算法,到现在 DeepSeek 能持续拿出硬核产品,这背后明显是长期积累的结果。MODEL1 的出现,更像是这种积累的必然爆发,而不是临时抱佛脚的产物。 现在全球开发者都在等着 MODEL1 正式开源,毕竟 R1 已经让大家尝到了甜头,国内有团队用它做 AI 数学教练,让学生解题速度提升 40%,非洲开发者还用它搭了农业病害诊断系统。 大家都期待 MODEL1 能带来更灵活的部署方式、更强的适配能力,甚至在更多细分场景里发挥作用。而 DeepSeek 选择在开源社区首发,也符合他们一直以来的思路 —— 把技术开放给更多人,让创新扩散得更快。 这波热搜也让更多人关注到中国 AI 的原创实力。以前总有人说中国 AI 是模仿为主, but 梁文锋带着团队用 R1 证明了咱们能做出经得住同行评审的顶尖模型,现在又马不停蹄推出 MODEL1,就是要打破这种偏见。 而且 DeepSeek 的开源策略也让技术不再被少数巨头垄断,不管是大企业还是小团队,甚至个人开发者,都能用上高质量的模型,这种开放的态度也让他们收获了不少好感。 说到底,MODEL1 在 R1 周年庆之际悄然现身,既是 DeepSeek 对过去一年成绩的呼应,也是对未来的布局。 梁文锋用实际行动证明,AI 领域的竞争不是靠嗓门大,而是靠真技术、真创新。现在 AI 圈的目光都聚焦在 MODEL1 上,等着看它正式亮相时能带来哪些突破。 而这波操作也给行业提了个醒,闷声干大事、踏实做技术,远比花里胡哨的营销管用得多。毕竟在技术圈,最终还是要用产品说话,DeepSeek 这步棋,确实走得又稳又准。
