UCLA团队揭示生物与AI协作机制的跨物种研究突破
加州大学洛杉矶分校(UCLA)Weizhe Hong团队在《Science》发表的最新研究,通过对比小鼠与人工Agent的合作行为,首次证实AI系统能形成与生物大脑相似的协作策略和神经表征。该研究为设计下一代协作型AI提供了生物学灵感,也为理解社会行为的神经基础开辟了新方向23。
小鼠合作行为的实验设计与核心发现
实验框架与协作表现
研究团队设计了双小鼠协作任务:将配对小鼠置于带透明分隔板的实验舱内,需在规定时间窗口内同步完成鼻触动作以获取饮水奖励。时间窗口从初始3秒逐步缩短至0.75秒,以提升协作难度。经过系统训练,76%的小鼠合作表现显著超过随机水平,其中41%属于“高表现组”。通过数据打乱实验验证,真实合作次数远高于随机概率,且鼻触间隔随训练推进持续缩短,证明小鼠通过主动协调而非偶然行为达成协作23。
关键协作机制验证
为排除非主动协调因素,研究设置三组对照实验,结果如下:
对照条件 协作指数变化 核心结论
透明板换为不透明板(阻断视觉) 协作几乎完全消失 视觉信号是跨个体信息感知的关键
单独鼻触即可获奖励 协作指数下降62% 互利动机是维持协作的必要条件
单方依赖同步鼻触奖励 协作精度降低47% 双向主动配合是高效协作的基础
神经基础:前扣带回皮层(ACC)的核心作用
研究发现,ACC神经元对协作结果具有高度特异性响应:
结果编码:部分神经元仅在正确协作时激活,另一部分仅响应错误协作,且正确响应神经元数量显著更多;
功能相关性:高表现组小鼠的ACC正确响应神经元比例比普通组高38%,且该比例与协作精度呈正相关;
决策解码:通过支持向量机(SVM)可从ACC神经信号中准确区分协作决策状态,证实ACC是协作行为的“神经中枢”23。
AI Agent对生物协作逻辑的复刻与创新
人工协作系统构建
研究团队基于多Agent强化学习(MARL)框架,使用循环神经网络(RNN)开发两个AI Agent,并在模拟小鼠实验的虚拟环境中训练其协作行为。虚拟环境复刻了生物实验的时间窗口机制和奖励规则,要求Agent通过同步“鼻触”动作获取虚拟奖励12。
AI协作行为的生物相似性
AI系统展现出与小鼠高度趋同的协作特征:
行为策略:当同伴远离目标位置时,Agent会表现出“等待行为”,通过最小化彼此距离差异主动协调动作;
精度提升:随训练推进,AI的错误协作次数减少53%,同步动作间隔缩短至2个时间步内;
情境适应性:在阻断“视觉信号”(屏蔽同伴位置信息)的模拟实验中,AI协作效率下降趋势与小鼠一致23。
研究意义与应用前景
该研究首次实现生物大脑与AI协作机制的直接对比,其核心价值体现在:
理论突破:证实跨物种(生物与人工系统)协作行为可能共享相似神经动态原理,为社会行为研究提供统一框架;
AI设计启示:提示通过模拟生物脑区(如ACC)的神经编码逻辑,可提升多Agent系统的协作智能,潜在应用场景包括自动驾驶编队、分布式机器人协同等23;
神经科学价值:为理解人类社交障碍(如自闭症)的神经机制提供动物模型,未来或通过AI模拟优化干预方案。
研究团队指出,下一步将探索灵长类动物更复杂的协作行为,并尝试在AI系统中复刻ACC的动态决策网络,以开发具备生物级适应性的协作型智能体