机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 81|回复: 0

给AI装了个"记忆" 它反而变蠢了

[复制链接]

2万

主题

3万

帖子

21万

积分

超级版主

Rank: 8Rank: 8

积分
216396
发表于 5 天前 | 显示全部楼层 |阅读模式
伊利诺伊大学和清华那边刚放出一篇研究,专门盯着大语言模型智能体的“记忆”做文章。
这帮人发现,当你让AI把自己的经验整理成漂亮的总结存起来,它的正确率反而往下掉。GPT-5.4,就是那个号称能推理能规划的家伙,在不加任何记忆的时候,能100%搞定一个小型ARC-AGI测试集。但一旦开启记忆重写功能,让它在每次任务后把经验“压缩”成一段精炼的总结,正确率直接跌到54%左右。从100%到54%,这已经不是“有点误差”了,这是在往反方向狂奔。

说白了,问题出在“压缩”这两个字上。你想啊,让一个AI去总结自己的经验,就像让一个刚学完一学期的人去写学期总结——他肯定会挑他觉得“重要”的东西写。但AI挑东西的标准跟你不一样。它可能觉得“红色方块=危险”这条规律很重要,但实际上只是因为最后一次碰到的红色方块恰好是陷阱。它把个例当规律,把巧合当真理。这就是论文里说的“过度泛化”和“过拟合”。
听起来很学术,但说白了就是记错了、记偏了、记傻了。

研究团队在网页购物、模拟世界、应用操作这些场景里反复测试,结论都一样:原始经验片段比精致总结更有价值。什么意思?就是你别让AI把每一次操作都“提炼”成一条金句,让它老老实实地把原始记录存着
就像你写代码的时候,如果只记“这个bug修好了”而不仅记“怎么修的、试了什么方法、走错了哪些路”,下次遇到类似问题你还是得从头来一遍。
有博主看完这篇论文后说了一句狠话:智能体的记忆应该把原始经验片段当成重要证据,而不是可随意压缩丢弃的便签。
这话说得太对了,你把原始数据丢了,只留一份摘要,那跟把实验记录扔了只留个结论有什么区别?
科学不是这么玩的,AI也不是这么学的。所以现在的问题是,市面上那些号称“能自我进化”的AI产品,到底是真的在进步,还是在不断给自己加戏?每次重写记忆都像在玩一个“传话游戏”。
第一个人说“猫在垫子上”,传到最后一个人那里变成了“垫子在猫身上”。
AI的自我总结也是这个道理,每一次压缩都在丢失信息,每一次重写都在引入偏差。








回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2026-5-26 05:32 , Processed in 0.054474 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表