给AI装了个"记忆" 它反而变蠢了

寂静回声 · 发表于 2026-5-21 13:08:36

伊利诺伊大学和清华那边刚放出一篇研究，专门盯着大语言模型智能体的“记忆”做文章。
这帮人发现，当你让AI把自己的经验整理成漂亮的总结存起来，它的正确率反而往下掉。GPT-5.4，就是那个号称能推理能规划的家伙，在不加任何记忆的时候，能100%搞定一个小型ARC-AGI测试集。但一旦开启记忆重写功能，让它在每次任务后把经验“压缩”成一段精炼的总结，正确率直接跌到54%左右。从100%到54%，这已经不是“有点误差”了，这是在往反方向狂奔。

说白了，问题出在“压缩”这两个字上。你想啊，让一个AI去总结自己的经验，就像让一个刚学完一学期的人去写学期总结——他肯定会挑他觉得“重要”的东西写。但AI挑东西的标准跟你不一样。它可能觉得“红色方块=危险”这条规律很重要，但实际上只是因为最后一次碰到的红色方块恰好是陷阱。它把个例当规律，把巧合当真理。这就是论文里说的“过度泛化”和“过拟合”。
听起来很学术，但说白了就是记错了、记偏了、记傻了。

研究团队在网页购物、模拟世界、应用操作这些场景里反复测试，结论都一样：原始经验片段比精致总结更有价值。什么意思？就是你别让AI把每一次操作都“提炼”成一条金句，让它老老实实地把原始记录存着
就像你写代码的时候，如果只记“这个bug修好了”而不仅记“怎么修的、试了什么方法、走错了哪些路”，下次遇到类似问题你还是得从头来一遍。
有博主看完这篇论文后说了一句狠话：智能体的记忆应该把原始经验片段当成重要证据，而不是可随意压缩丢弃的便签。
这话说得太对了，你把原始数据丢了，只留一份摘要，那跟把实验记录扔了只留个结论有什么区别？
科学不是这么玩的，AI也不是这么学的。所以现在的问题是，市面上那些号称“能自我进化”的AI产品，到底是真的在进步，还是在不断给自己加戏？每次重写记忆都像在玩一个“传话游戏”。
第一个人说“猫在垫子上”，传到最后一个人那里变成了“垫子在猫身上”。
AI的自我总结也是这个道理，每一次压缩都在丢失信息，每一次重写都在引入偏差。

		自动登录	找回密码
密码			立即注册

给AI装了个"记忆" 它反而变蠢了

浏览过的版块