科技中国

AI
业界 手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

斯坦福大学、华盛顿大学研究:1000 个 AI 智能体预测人类行为,准确率最高可达 85%

2024-11-26 08:13:34 来源:IT之家 A+A-

11 月 25 日消息,据 The Decoder 今日报道,斯坦福大学、华盛顿大学和 Google DeepMind 的研究人员联合开发了一种 AI 智能体(AI Agent,也称“AI 代理”),能够在社会实验中逼真地模拟人类行为。

研究指出,这类模拟系统可以作为一个虚拟实验室,帮助验证经济学、社会学、组织学和政治科学中的理论。研究团队通过对 1000 多名具有代表性的美国人(覆盖多种年龄、性别、教育背景和政治立场)进行访谈,建立了这些 AI 智能体模型。

系统运行方式是将详细的访谈记录与 GPT-4o 模型结合。当用户向智能体提问时,系统会加载访谈记录并让 AI 模仿受访者的回答。为生成这些记录,研究团队对每位受访者进行了长达两小时的访谈,并通过 OpenAI 的 Whisper 技术将对话转录成文本。

研究团队设计了多个测试,评估 AI 对人类行为的预测能力,涵盖《通用社会调查》、大五人格评估以及若干行为经济学实验。

结果显示,基于访谈数据的 AI 在预测社会调查(GSS)问题时,准确率高达 85%,远超单纯依赖人口统计信息的 AI 智能体。

研究团队在五项社会科学实验中测试了人类与 AI 的表现,其中四项研究显示,AI 的结果与人类高度一致。相关系数高达 0.98,表明 AI 对人类行为有极强的模拟能力。

与传统的人口统计法相比,访谈驱动的 AI 显示出显著的优势,尤其是在处理不同种族群体和政治观点的预测时更加准确,同时也能有效减少人口统计类别之间的偏差。

研究团队已将包含 1000 个 AI 模型的数据集开放至 GitHub,并建立了两层访问机制。综合性数据对研究人员完全开放,而个别参与者的详细数据则需经过特殊审批。

附数据集地址:

  • https://github.com/joonspk-reseARch/genagents

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

Tags:AI
(责任编辑:Diy92)

推荐阅读 相关文章

百度地图展示智能眼镜解决方案:提供 AR导航功能,接入DeepSeek

3 月 18 日消息,在 VisionX AI 智能眼镜产业大会上,百度地图今日宣布推出智能眼镜解决方案。该方案通过自然语...[详细]

2025-03-18 16:31:39

AI 企业第4范式宣布成立范式集团,布局消费者电子业务

3 月 18 日消息,第四范式董事长戴文渊今日在发布会上宣布,将成立范式集团,原第四范式业务将成为范式集团的核心...[详细]

2025-03-18 16:31:39

谷歌升级Gemini 2.0 系列模型,AI助手可免费深层推理

3 月 18 日消息,谷歌公司昨日(3 月 17 日)发布博文,宣布通过升级 Gemini 2.0 模型,推出"AI Overviews"和"AI Mode...[详细]

2025-03-18 16:31:39

Roblox发布AI建模工具:仅需几句提示词就能生成3D物体

3 月 17 日消息,Roblox 今日推出了 3D 模型工具"Cube"的首个版本,旨在帮助创作者利用生成式 AI 制作 3D 物体...[详细]

2025-03-18 16:31:39

阿里 QwQ-32B 大模型集成至国家超算互联网平台 Chatbot 可视化对话 / API 在线调用服务

3 月 17 日消息,国家超算互联网平台今日发文宣布 MaaS 服务再上新:QwQ-32B 推理大模型正式集成至 Chatbot 可...[详细]

2025-03-18 16:31:39

雷神 AiBook 14 Air 笔记本正式开卖:搭载锐龙 R7-8745HS 处理器、2.8K 120Hz 高刷屏 限时特价仅4299元

4 月 6 日消息,雷神 AiBook 14 Air 笔记本已在京东平台开售,新机搭载锐龙 R7-8745HS 处理器、配备 2.8K 120Hz...[详细]

2025-04-07 07:31:52

联想“一体多端”AI终端新品官宣5月发布:含拯救者 AIPC、moto 手机及平板电脑等

4 月 3 日消息,联想今日发布预热视频,并宣布"一体多端"AI 终端新品将于 5 月发布,包括全新 moto AI 手机(折叠屏...[详细]

2025-04-04 10:54:53

据称微软将取消北美和欧洲多个 2GW 电力 AI 数据中心建设项目

3 月 30 日消息,投资银行 TD Cowen 发布报告,称微软已经取消了在北美和欧洲涉及 2GW 电力的多个数据中心建设...[详细]

2025-03-31 08:06:09

古尔曼:苹果计划将“健康”App 打造成你的 AI 教练、私人医生、营养师

3 月 30 日消息,古尔曼在今日的《Power On》时事通讯中爆料,苹果计划将健康应用扩展为一个智能健康助手,继续收...[详细]

2025-03-31 08:06:09

研究证明:“不完美”的AI美食图片会令人感到不适

3 月 27 日消息,一项新研究揭示了为何人工智能(AI)生成的食品图片有时会令人感到不安,这给该技术在广告领域取代...[详细]

2025-03-28 07:30:56

联系方式