400 128 6709

行业新闻

「社交达人」GPT-4!解读表情、揣测心理全都会

发布时间:2023-07-22点击次数:

想象一下,您正在参加一个充满活力的鸡尾酒会,局间充满了热烈的谈话声和玻璃杯碰撞的叮当声。

此时,您作为一个悠闲的观察者,怡然自得地躲在角落里。然而,就算没有处在聚会的中心,您还是可以轻松地弄清楚不同人之间的社会关系,了解正在发生的事情,甚至通过阅读人们的言语和非言语线索来读懂明里暗里的社交信息。

如果一个LLM能够复现这种水平的社交能力呢?这不,Koko Mind就是这么个东西。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

「社交达人」GPT-4!解读表情、揣测心理全都会

随便打开一个视频,该模型就开始分析人物表情,得出人物情绪的结论。

然后,在右侧的prompt栏还可以提出问题,让AI进一步分析视频中暗流涌动的社交谜题。

(说实话对有些人来说这都很难)

「社交达人」GPT-4!解读表情、揣测心理全都会图片

Koko Mind包含了150个复杂的多方社交互动以及自由文本问题和答案。

为了确保数据的多样性和可扩展性,并避免数据污染,所有社交互动、问题和答案均由GPT-4生成,并随后由人类专家验证。

分析数据基于三个不同的来源:

  • GPT-4-only:该子集仅由 GPT-4 通过提示创建。
  • 基于电影:为了避免数据污染,这部分数据基于从2025年之后上映的电影中提取的各种场景。GPT-4负责塑造这些场景,在保留核心本质的同时添加了自己的元素。
  • 基于 ToMi:该部分包含由模拟数据集ToMi支持的数据,其中涉及将物理对象移动到不同的地方,这是心理理论的经典测试。当然,这些社交互动还得被GPT-4修饰和扩展一下。

三种数据来源的占比如下:

「社交达人」GPT-4!解读表情、揣测心理全都会图片

对于每次社交互动,研究人员都会提出各种问题,旨在探讨以下几个和社交理解息息相关的方面。

  • 心理理论:评估对其他人心理状态和观点的理解的问题。
  • 社会规范:旨在辨别情境中的社会价值观和规范的问题。
  • 情绪识别:旨在识别和理解上下文中的情绪元素的问题。
  • 社会关系:关注人际动态和关系。
  • 反事实问题:旨在探索替代结果或可能性的假设查询。
  • 社会建议:提出与特定情况相关的建议或行动建议的问题。

研究人员以text-d*inci-003 作为参考,评估了AlpacaEval后的不同模型。

其中,研究人员从上下文中删除了括号中的非语言线索(例如,紧张地喝咖啡等)。

以下则是一些有趣的要点:

  • 在两个模型中,与Claude相比,GPT-4在识别获胜模型方面表现出更大的确定性和信心。
  • 当上下文没有非语言线索,且交互要么完全由GPT-4生成,要么基于电影时,Claude的表现优于 GPT-4。
  • 而如果上下文包含了非语言线索,那GPT-4总是比Claude更好。

(一种可能的解释是,GPT-4是一种多模态模型可以更好地理解额外的非语言信息。)

在博客中,研究人员绘制了表格,可以清晰的看到各个模型的表现。

「社交达人」GPT-4!解读表情、揣测心理全都会图片

结果虽然在很多方面都令人兴奋,但也有一定的局限性。首先, Koko Mind的规模相对较小,这可能会限制研究人员结论的广泛适用性和全面性。

其次, Koko Mind中的所有交互都是由GPT-4生成的,需要人工验证,这使得数据集难以扩展。

另外,虽然Koko Mind在数据集中提供了经过人工验证的答案,研究人员在评估时没有使用这些答案作为参考,并且由于这些答案是由GPT-4生成的,因此它们可能会偏向GPT-4。

未来的研究可以集中在如何评估模型上具有经过人工验证的机器生成的参考答案。

当然,虽说存在这样或那样的限制,研究人员仍将Koko Mind视为未来与社会智能、多模态语言模型等相关的研究的跳板。

以上就是「社交达人」GPT-4!解读表情、揣测心理全都会的详细内容,更多请关注其它相关文章!


# 怎么处理  # 盘锦网站优化厂商名单  # 新站点seo价格  # 邯郸抖音seo矩阵公司  # 京东网站推广方式有几种  # 网站推广职位名称  # seo家居活动方案  # 服装营销推广设计  # 珠海定制网站建设  # SEO收录有什么作业  # 宿迁网站建设怎么选  # 这是  # gpt-4  # 社会关系  # 重庆  # 自定义  # 是由  # 老照片  # 互动  # 自己的  # 达人  # claude  # 社交 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 日本演员工会提出AI立法建议 要求建立“声音肖像权”  Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务  人形机器人打开精密齿轮市场全新空间!受益上市公司梳理  小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学  WHEE安装教程  联想举办2025创新开放日,展出260余项算力及AI产品技术  特斯拉人形机器人将于 7 月亮相上海 2025 世界人工智能大会  周鸿祎:用超级AI实现室温超导和核聚变,实现能源自由  全媒封面丨⑤商汤科技:原创AI算法“发电厂”  阿里云全面支持Llama2训练部署,助力企业快速构建自有大型模型  Meta将VR头显最低年龄限制从13岁降至10岁  【首发】首款“消化内镜手术机器人”进入临床尾声,ROBO医疗获数千万元A轮融资  “痴迷”元宇宙,魔珐科技想做什么?  Zoom远程会议应用:AI培训需经用户授权  第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》  插画师对AI绘画软件的态度是怎样的?  2025 WAIC|美团无人机发布第四代新机型  AI时代,企业需要什么样的员工?  你们的开机第一屏画面要变了!安卓机器人首次3D化  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  “智能体动作生成技术”现身WAIC:游戏AI技术为机器人科创注入新动力  XREAL Beam 投屏盒子正式发布:支持“可悬停 AR 空间屏”  烟台大学学生首次在全国大学生无人机航拍竞赛中获奖  Hugging Face发布了基于NASA卫星数据构建的AI地理空间基础模型  阿里云AI绘画创作大模型通义万相发布 已开启定向邀测  Moka发布AI原生HR SaaS产品“Moka Eva”,布局AGI时代  苹果机器学习关键人物 Ali Farhadi 离职,回归 AI2 担任 CEO  江永:精准施训提升通信无人机应急救援能力  人工智能时代 数字文明对话向“尼”走来  学而思推出AI第一课:基于自研大模型的AIGC课程  脑虎科技:奔跑在“脑机接口”最前沿 跨界融合取得阶段性成果  2025VR&AR显示技术峰会展示歌尔光学最新一代光学模组  昌吉市利用无人机实现全天候河道动态巡检  IBM 与 NASA 携手开源地理空间 AI 模型,促进气候科学研究进步  马斯克称人类是半机器人,记忆外包给了电脑  GPT-4 模型架构泄露:包含 1.8 万亿参数、采用混合专家模型  谷歌将使用公开信息训练 AI 模型,构建更强大的自家产品  联想浏览器引入小乐 AI 助手,成功接入百度文心一言大模型,经过实测证实  鸿蒙生态带来了哪些新的流量可能性,包括AI、服务分发和原生智能等方面?  为什么很多人对纽约《人工智能招聘法》感到生气?  无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA  基于信息论的校准技术,CML让多模态机器学习更可靠  OpenAI宣布组建新团队 以控制“超级智能”人工智能  机构研选 | 虚拟电厂是电力物联网升级版 智能电网望迎来高速发展  B站内测 AI 搜索功能,输入“?”即可体验  脑机接口产业联盟发布十大脑机接口关键技术  即将到来:AI婚纱设计软件实际测试,人工智能即将开创婚纱设计新纪元  Meta发布语音AI模型 Voicebox 助虚拟助手与NPC对话  小米又拿下国际比赛第一:AI翻译立功  AI数字人业务频频获点赞,谦寻积极引领示范作用 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司