【王阳明代数】A foundation model to predict and capture human cognition论文解析

A foundation model to predict and capture human cognition论文解析

A foundation model to predict and capture human cognition

预测和捕捉人类认知的基础模型

建立统一的认知理论一直是心理学的主要目标。

虽然之前有人试图通过构建计算模型来实例化这些理论,但我们目前还没有一个模型能够完整地捕捉到人类的思想。

朝着这个方向迈出的第一步是创建一个可以在各种环境中预测人类行为的模型。

在这里,我们介绍Centaur,这是一种计算模型,可以预测和模拟任何用自然语言表达的实验中的人类行为

我们通过在名为Psych-101的新型大规模数据集上微调最先进的语言模型来推导CentaurPsych-101达到了前所未有的规模,涵盖了来自60000多名参与者的试验数据,他们在160个实验中进行了超过10000000个选择。

Centaur不仅比现有的认知模型更好地捕捉了参与者的行为,而且还将其推广到新的封面故事结构任务修改和全新的领域。此外,我们发现,经过微调后,模型的内部表示与人类神经活动更加一致。

综上所述,我们的结果表明,有可能发现在广泛领域捕捉人类行为的计算模型。 我们认为,这些模型为指导认知理论的发展提供了巨大的潜力,并提出了一个案例研究来证明这一点。

A foundation model to predict and capture human cognition
人类的思维非常普遍。

我们不仅经常做出平凡的决定,比如选择早餐麦片或选择一套衣服,还应对复杂的挑战,比如如何治愈癌症或探索外太空。

我们只从几次演示中学习技能,理性地推理,并通过好奇心来激励我们的行为。无论我们是爬山、玩电子游戏还是创作迷人的艺术,我们的多才多艺都定义了人类的意义。

相比之下,大多数当代计算模型,无论是在机器学习还是认知科学中,都是特定领域的。

它们被设计成擅长一个特定的问题,而且只擅长那个问题。例如,AlphaGo是由谷歌DeepMind创建的计算机系统,用于掌握Go7的游戏。

该系统可以在令人印象深刻的水平上玩这个特定的游戏,但除此之外它无能为力。在认知科学中也可以观察到类似的模式。

  • 例如,前景理论是人类认知最具影响力的解释之一,它为人们如何做出选择提供了宝贵的见解8,但它告诉我们如何学习、计划或探索。

如果我们想全面理解人类的思想,我们必须从特定领域的理论转向综合理论。我们领域的先驱们已经认识到这种统一方法的重要性。

  • 例如,1990年,有人说“统一的认知理论是将[我们]美妙的、不断增长的知识基金置于智力控制之下的唯一途径”。我们如何才能朝着这些理论取得有意义的进展?

迈向统一认知理论的重要一步是建立一个计算模型,可以预测和模拟任何领域的人类行为2,9。

在本文中,我们接受了这一挑战,介绍了人类认知的基础模型CentaurCentaur是通过在大量人类行为语料库上微调最先进的大型语言模型11,以数据驱动的方式设计的。为此,我们策划了一个名为Psych-101的大型数据集,该数据集涵盖了160个心理实验的逐个试验数据(参见方法、“数据收集”和扩展数据图1)。我们将每个实验转录成自然语言,这为表达截然不同的实验范式提供了一种通用格式。

由此产生的数据集具有前所未有的规模,包含超过10000000个人类选择,包括来自多武装土匪、决策、记忆、监督学习、马尔可夫决策过程等领域的许多典型研究。

我们对Centaur进行了一系列严格的测试,并证明它在几个泛化水平上捕捉到了人类行为。

  • 首先,我们发现Centaur在几乎每一个实验中都比现有的认知模型更好地预测了坚持参与者(那些不属于训练数据的人)的行为。

  • 然后我们证明,它捕捉人类行为的能力也可以推广到持续的实验中。在这种情况下,我们发现Centaur在修改过的封面故事、问题结构甚至全新的领域中都能准确预测人类行为。最后,我们发现Centaur的内部表征变得更加符合人类,尽管它从未被明确训练来捕捉人类的神经活动。

综上所述,我们的结果表明,有可能发现在广泛领域捕捉人类行为的计算模型。 我们认为,这种预测模型为更好地理解人类思维提供了许多直接的机会,我们提供了一个案例研究来证明这一潜力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值