[LG]《Fine-Tuning Dynamics of In-Context

[LG]《Fine-Tuning Dynamics of In-Context Factual Recall in Transformers》R Huang, E Nichani, J D. Lee, R Ge [Duke University & Princeton University & UC Berkeley] (2026)

在上下文学习中，模型如何调取参数记忆仍是黑箱。过去理论只看提示内信息，本质上绕开了“先识别关系、再取事实”的链条。

本文的核心洞见是：把事实回忆看作关系推断后的记忆寻址。由此，成对注意上下文样例，使隐藏关系被锁定，答案才能从MLP记忆中读出。