发布时间:2025-11-04
点击次数: 
由英国政府AI安全研究所联合多所顶尖高校的计算机科学家开展的一项研究揭示,当前广泛用于衡量新一代人工智能(AI)模型安全性与效能的评估体系存在普遍性漏洞。研究人员对超过440个现有基准测试进行了系统分析,结果发现几乎每一项测试都在设计或执行层面存在某种形式的缺陷,可能严重影响其评估结果的可信度。
牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)作为该研究的主要负责人指出,这些基准测试本应是验证新型AI系统是否安全、可控并符合人类价值观的关键手段。然而,由于行业缺乏统一的技术标准和严谨的验证机制,目前很难判断AI模型的实际表现是在持续提升,还是仅仅在特定测试条件下“看起来”更优。
在美英两国尚未建立全面AI监管框架的现状下,这类基准测试实际上承担着类似“自我监管”的角色,成为科技公司在发布新AI产品前的重要参考。但近年来已有多起因AI输出有害内容而被迫下架产品的案例。例如,谷歌此前不得
不撤回其开源AI模型Gemma,原因是该模型生成了关于一名美国参议员的虚假负面信息,引发公众强烈质疑。
Mistral AI
Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台
182
查看详情
谷歌随后澄清称,Gemma原本面向开发者和研究人员,并非为大众用户设计,在发现被不当使用后迅速采取了回收措施。研究还指出,大多数基准测试缺乏对结果不确定性的量化分析,仅有16%的测试采用了统计显著性检验等科学方法。同时,在评估如“无害性”“公平性”等关键属性时,相关标准定义模糊、主观性强,导致不同测试之间难以横向比较。
为此,研究团队呼吁全球AI社区共同推动建立开放、透明且标准化的评估框架,制定通用的最佳实践指南,以增强AI安全测试的可靠性与可重复性,从而真正保障技术发展的稳健与可信。
以上就是数百项 AI 安全测试存在严重缺陷的详细内容,更多请关注其它相关文章!
# 互联网
# 网站建设公司 临沂
# 黄冈网站app推广下载官网
# 营销推广简历优缺点
# 新浦营销推广费用
# SEO的含义和象征
# 原神推广视频官方网站在哪
# 优化汽车网站排名
# 唐山网站优化机构
# 蓬莱智能营销推广定制
# 搜索运营和seo
# 是在
# 计算机
# 牛津
# 年中
# 之父
# 英国政府
# 百项
# 欧洲
# 微软
# 押注
# ai
# 谷歌
# 人工智能
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
ChatGPT设计出的第一个机器人来了!【附人工智能行业预测】
谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型
生成式人工智能进入产业应用!但再“聪明”仍是工具,最终目的是服务于人
商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行
人工智能时代的科幻译者怎么办?“做好翻译工作的高端10%”|文化观察
深企派遣无人机救援队赴京津冀开展防汛救灾任务
世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单
自然语言生成在智能家居设备中的应用
AI 大模型重塑软件开发,有哪些落地前景和痛点?| ArchSummit
南京制造的国产工业机器人:在外资品牌竞争中突围,年销售1.8万台
Midjourney创始人:AI应该成为人类思想的延伸
特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量
谷歌推出 AI 反洗钱工具,可将金融机构内部风险预警准确率提高2至4倍
AI浪潮席卷,时空壶为何能成为AI翻译时代的破局者
爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT
美妆行业在AI时代蓬勃发展
数据科学,解码智能未来——Altair首次提出“Frictionless AI”概念
对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型
华为昇腾AI原生支持30多种基础大模型,包括GPT
阿里云推出通义万相AI绘画大模型
跑不动的元宇宙,虚拟世界比现实更冷酷
报告称 70% 程序员已使用各种 AI 工具编程
万魔推出AI主攻的运动耳机,开启十年研发新纪元
小米9号员工李明宣布创业:打造首款安卓桌面机器人
AI新视野,增长新势能,伙伴云受邀出席笔记侠创业讲真话AI峰会
Valve Index VR 头显销量下滑,上市四年的长青树渐失光彩
人工智能大胆预测:银河系至少有2万个地球,36种外星文明
小米又拿下国际比赛第一:AI翻译立功
腾讯TRS之元学习与跨域推荐的工业实战
“直击”AI新世界,智能机器人再次“火出圈”了
调查显示:实际上没有那么多人在用 ChatGPT
李开复:未来几年,人工智能会革了所有人的命,除非你这么做
谷歌计划在上海举办开发者大会,重点关注机器学习和生成式AI领域
杀入生成式AI的亚马逊云科技,能否再次生成未来?
天翼云在国际AI顶会大模型挑战赛中获得冠军
参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器
马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧
人工智能行业急缺人 AI人才年薪能达近42万元
WHEE安装教程
OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示乐观
AMD称下半年AI显卡供应充足,不需要像NVIDIA那样加价抢购
腾讯AI首次模拟拼接三星堆文物,工作取得阶段性的成果
亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资
人工智能赋能无人驾驶:商业化进程再提速
第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》
字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA
消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像
当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来
第四范式「式说」大模型入选《2025年通用人工智能创新应用案例集》
Nature封面:量子计算机离实际应用还有两年