泡泡资讯网

DeepSeekV4的大模型参数比V3有什么变化总参数量:V4-Pro 约 1.

DeepSeekV4的大模型参数比V3有什么变化总参数量:V4-Pro 约 1.6万亿 / 1.6T(V3为6710亿 / 671B)。总参数量大幅提升,意味着模型的“知识容量”更大,绝对值约是V3的2.4倍。激活参数量:V4-Pro 约 490亿 / 49B(V3为370亿 / 37B)。激活参数增幅有限,MoE路由更稀疏,保证了推理成本和效率的稳定。