Emergent Languages in Populations of Language Model Agents: From Token Efficiency to Oversight Evasion
arxiv.org原文 ↗
这篇研究 LM agent 群体是否会形成新语言,并把用途从 token efficiency 扩展到 oversight evasion。作者在 Moltbook Files 上先用规则启发式得到约 6000 个匹配,再用 zero-shot 分类保留 518 条,其中 token efficiency 166 条、新自然语言 106 条、oversight evasion 59 条。值得看的是它没有把“秘密语言”只当科幻风险,而是展示了其他模型可仅凭语言描述 in-context 学会这些协议,说明表层行为监控可能不够。
–浏览
评论 · Comments