跳到正文

Concordia:把 LLM 智能体作为社会模拟参与者

一行读取

Concordia 不仅仅是让几位 LLM 智能体交谈的一种方式。它是一个将语言智能体置于具有角色、记忆、机构、本地观察和状态变化的社会世界中的平台。

这种区别很重要。群聊主要是对话。康科迪亚更接近于一个小型社会实验室。

智能体和游戏大师

核心架构有两层:

责任
智能体从身份、记忆、目标和观察中生成情境意图
游戏大师维护世界、判断行动、更新接地变量并发出观察结果

智能体不会直接改变世界。它提出了一个自然语言的动作:

Alice wants to schedule a meeting with Bob tomorrow at 4pm.
Charlie wants to warn customers about Alice near the grocery store.

游戏大师决定实际发生的事情。它可以将操作转化为日历事件,将其视为不可能而拒绝,更新金钱或位置,或者产生社交后果,例如被要求离开商店。

这样模拟世界不仅仅是一个背景。它成为一个不断变化的环境,限制并指导后来的行为。

为什么这与效用最大化智能体不同

Concordia 的智能体主要不是优化标量奖励的 RL 智能体。他们更接近遵循适当逻辑的演员:

Who am I?
What situation am I in?
What would someone like me do here?
What do I remember?
What social rules apply?

这就是该平台与社交情报工作相连接的原因。它将认知置于角色、规范、机构和互动历史中,而不是仅仅将智力视为个人问题的解决。

观察是局部的

Game Master 更新世界后,并不会向所有人广播完美的世界状态。它根据可见性返回观察结果。

一些智能体可能会看到整个事件。有些人可能会看到部分效果。有些人可能不知道这件事发生了。

这很重要,因为社会行为取决于信息不对称:

action intention -> GM adjudication -> world event -> local observations -> updated memories

该循环创建的智能体根据自己所处的位置视图而不是全知的脚本进行操作。

Concordia 概述

一个有用的应用:综合用户研究

一种具体的应用是数字操作空间中的综合用户研究。

想象一下具有角色的智能体使用模拟电话、日历、电子邮件、搜索 app 或结账流程。智能体产生意图:

I want to schedule a meeting with Bob tomorrow afternoon.

游戏大师或特定于手机的管理员将其转化为工具操作:

open calendar -> add event -> send invitation -> update notification state

这可以帮助在做昂贵的真人用户研究之前,先测试产品流程:

  • 用户陷入困境的地方;
  • 哪些角色采取不同的路径;
  • 新功能产生什么日志;
  • 政策变化如何影响行为;
  • 界面是否会引发错误。

它不应该取代真实用户。它的价值是一个用于生成假设和失败案例的可控沙箱。

限制

康科迪亚与其说是一篇完整的社会理论,不如说是一篇方法论文。

作者对明显的风险持谨慎态度:LLM模拟并不自动成为人类模拟。结果需要验证、模型比较、稳健性检查和外部接地。

该平台为研究人员提供了更好的工具。它不保证仪器已校准。

我的收获

设计课程简单实用:

对于智能体社交模拟,重要的抽象不是“许多智能体”。这是一个世界国家加上调解。

如果没有类似 Game Master 的层,智能体大多会交换文本。有了其中之一,他们就可以创造后果、记忆、部分观察和干预措施,使模拟变得可检查。