[LG]《EvolKV:EvolutionaryKVCacheCompr

爱生活爱珂珂 2025-09-12 06:40:05

[LG]《EvolKV: Evolutionary KV Cache Compression for LLM Inference》B Yu, Y Chai [University of Chinese Academy of Sciences & ETH Zurich] (2025)

EvolKV：首个基于进化算法的LLM KV Cache层级压缩框架，打破传统启发式分配限制，实现任务驱动的动态缓存预算优化。

• 重新定义KV Cache分配为多目标优化问题，兼顾内存效率与下游任务性能，采用CMA-ES进化策略，基于任务反馈迭代调整各层缓存预算。

• 采用层级分组机制（最佳组大小为8层）缩减搜索空间，提高算法稳定性与优化效率，支持多种性能指标（准确率、F1等），无需模型微调或架构改动。

• 在Mistral-7B-Instruct和Llama-3-8B-Instruct两个模型及11个任务上验证，覆盖长上下文检索、推理及数学题，显著领先PyramidKV、SnapKV、StreamingLLM等基线，最高提升7个百分点准确率。

• 低至1.5%缓存预算下，EvolKV在代码补全任务上超越全缓存性能，揭示非均匀、非金字塔式缓存分布对性能贡献的重要性。

• 优化结果具备强泛化能力，训练集外数据同样表现优异，支持预算从低到高平滑扩展，适配多模型系列及复杂长上下文任务。

• 推理时间和峰值内存消耗与现有压缩方法相当，远低于全缓存方案，具备极佳的实用部署价值。

心得：

1. KV Cache需求在不同层存在显著异质性，固定或金字塔式分配忽视了层间功能差异，任务驱动的动态分配更贴合模型实际信息处理机制。

2. 通过进化算法结合下游任务反馈，可有效探索复杂的非线性预算分配空间，避免人工规则的局限，提升长上下文推理能力。

3. 低预算下的非均匀缓存策略不仅节省资源，还可能激发模型更优表现，突破传统认为“更多缓存必然更好”的认知。

了解更多🔗arxiv.org/abs/2509.08315

人工智能大模型缓存压缩进化算法长上下文推理模型优化

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

[CL]《Beyond Ten Turns: Unlocking Long-Ho

2

早！[太阳] 早安

3

如何突破传统笔记误区，实现高效学习？Jeffrey Kaplan 教授为你揭示笔

4

Anthropic团队揭秘了Claude模型的XML提示技巧，真正“用它的语言方

5

如何将应用规模从0扩展到100万用户？实战路径全解析：1. 预发布阶段• 采用静

6

对比解析：LLM、RAG 与 Agent 的智能进化路径• LLM（大语言模型）

7

每次重复调用 LLM 都是在烧钱，传统缓存只能精确匹配，无法解决语义多样性问题。

8

[CL]《Efficient Knowledge Probing of Larg

9

[CL]《ConlangCrafter: Constructing Langua

10

[CL]《GLM-4.5: Agentic, Reasoning, and Co

热门分类

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

4

史上最薄iPhoneiPhoneAir现场真机实拍这外观给几分？

5

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

6

买手机不要着急，买新不买旧。9月10月份将有大量新机发布，配置提升，续航也提升

7

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

8

小米澎湃OS3官宣8月28日发布了，而且值得一提的是这次是OS3单开一场，可

9

真我15000mAh新机曝光，从系统UI来看，这款手机似乎就叫“15000mAh

10

小米澎湃OS3眼看小米澎湃的发布会要开了，这次升级最核心的就是手机系统，改动确实

科技最新文章

1

大家要的iPhone17标准版和iPhone16标准版的对比来了，升级大的地

2

安卓难受了，iPhone17居然降价了！啊，真的要大声尖叫了，你以为今年iPh

3

荣耀吃了大补丸，堆料这么猛？好家伙钢铁侠的爆料真是吓人，荣耀Magic8Pro的

4

荣耀CEO李健首曝了荣耀Magic8，他表示这一代的Magic8系列，不仅具有最

5

iPhone17变成印度制造，瞬间觉得不香了苹果已将面向美国的iPhone

6

当年莫妮卡一脚踩进我心，她踩的那款手机我花2千5百块钱。无脑就入了。现在妹子跑了

7

王腾走了，红米突然不会走路。领导真空、路线摇摆、信任裂缝，三条裂缝同时撕开。

8

什么叫“人走茶凉”？看看王腾的经历就明白了！刚刚宣布从小米离职，转眼就被

9

库克这是吃错药了吧！！这代iPhone17标准版居然这么猛，Pro系列还咋卖

10

iPhone17系列价格省流总结17系列，苹果近10年升级最大的一次，无论买哪