DeepSeek创始人梁文峰再次语出惊人!他说:“我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。” 梁文峰毕业于浙江大学信息与电子工程专业,本硕均专注人工智能方向。早期他探索机器学习在量化投资的应用,2015年创立幻方量化,公司迅速成长为国内头部量化私募,管理规模一度超过千亿。2020年至2021年,公司投入巨资建设超级计算集群,搭载上万张高端显卡,为后续技术转型奠定算力基础。 2023年7月,梁文峰成立杭州深度求索人工智能基础技术研究有限公司,团队规模控制在百余人,主要成员为本土年轻研究员和顶尖高校毕业生。公司专注基础大模型研发,坚持开源策略,从底层架构优化入手,避免直接进入应用市场。这种选择源于对行业生态的判断,旨在推动本土技术积累。 梁文峰在多个访谈中分析,中国人工智能常被认为落后美国一到两年,但实际差距体现在原创贡献与跟随策略上。如果不转变,中国企业难以主导技术方向,必须有人开展前沿探索。他指出,西方领先得益于长期社区积累,能提前把握趋势并规划路径。中国团队在工程效率和成本控制上优势明显,却需构建完整生态,许多技术受限于信息滞后。 他强调,过去中国公司多利用海外创新进行应用变现,这种模式难以持久。DeepSeek选择专注模型结构研究,推动全球进步,通过公开权重和训练细节促进行业协作。公司目标是通过架构创新缩小训练和数据效率差距,四倍资源消耗的现状正逐步改善。硅谷对公司成果的惊讶,源于看到中国企业以贡献者身份参与竞争。 梁文峰认为,创新需信念支撑,许多企业因信心不足转向应用层。公司优先技术前沿,团队以本土人才为主,注重基础能力和创造性。经验并非决定因素,长远本土培养可产生顶尖成果。他补充,颠覆性领域封闭壁垒短暂,开源加速生态成长。公司估值上升源于性能突破,但核心在于团队积累和技术文化。这些表述推动行业反思本土路径。 公司模型迭代持续推进,2024年5月发布DeepSeek-V2,采用混合专家架构提升效率。同年12月推出DeepSeek-V3,总参数671亿,训练成本大幅降低,在基准测试中超越多数开源模型。2025年1月发布DeepSeek-R1,推理能力接近国际闭源顶尖产品,迅速登顶应用下载榜。公司坚持开源核心工具,团队专注本土人才培养,估值显著增长,继续领导研究,推动中国人工智能向原创贡献转变。 中国AI发展正处于关键转折点,原创能力已成为决定性因素。DeepSeek的实践证明,通过专注基础研究和开源协作,本土企业能显著缩小差距,甚至在某些领域领先。
