英伟达开源9B小模型英伟达9B模型比Qwen3快6倍英伟达开源了9B参数的小语言

量子位看科技 2025-08-19 15:44:04

英伟达开源9B小模型英伟达9B模型比Qwen3快6倍

英伟达开源了9B参数的小语言模型Nemotron Nano v2,主打一个字:快。

在复杂推理任务上,准确率对标Qwen3-8B,但速度最高提升6倍。关键是,它支持“思考预算”——你可以指定它在思考过程中最多生成多少token,再决定是否输出答案。

这已经不是英伟达第一次表达对小模型的偏爱,此前在论文“Small Language Models are the Future of Agentic AI”中就直言:小模型才是智能体的未来。

除了模型,这波还开源了大部分训练数据,包括一个多达66万亿token的预训练语料库,下面来看Nemotron Nano v2的亮点:

0 阅读:0

猜你喜欢

量子位看科技

量子位看科技

感谢大家的关注