400 128 6709

行业新闻

数百项 AI 安全测试存在严重缺陷

发布时间:2025-11-04点击次数:

数百项 ai 安全测试存在严重缺陷

由英国政府AI安全研究所联合多所顶尖高校的计算机科学家开展的一项研究揭示,当前广泛用于衡量新一代人工智能(AI)模型安全性与效能的评估体系存在普遍性漏洞。研究人员对超过440个现有基准测试进行了系统分析,结果发现几乎每一项测试都在设计或执行层面存在某种形式的缺陷,可能严重影响其评估结果的可信度。

牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)作为该研究的主要负责人指出,这些基准测试本应是验证新型AI系统是否安全、可控并符合人类价值观的关键手段。然而,由于行业缺乏统一的技术标准和严谨的验证机制,目前很难判断AI模型的实际表现是在持续提升,还是仅仅在特定测试条件下“看起来”更优。

在美英两国尚未建立全面AI监管框架的现状下,这类基准测试实际上承担着类似“自我监管”的角色,成为科技公司在发布新AI产品前的重要参考。但近年来已有多起因AI输出有害内容而被迫下架产品的案例。例如,谷歌此前不得不撤回其开源AI模型Gemma,原因是该模型生成了关于一名美国参议员的虚假负面信息,引发公众强烈质疑。

Mistral AI Mistral AI

Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台

Mistral AI 182 查看详情 Mistral AI

谷歌随后澄清称,Gemma原本面向开发者和研究人员,并非为大众用户设计,在发现被不当使用后迅速采取了回收措施。研究还指出,大多数基准测试缺乏对结果不确定性的量化分析,仅有16%的测试采用了统计显著性检验等科学方法。同时,在评估如“无害性”“公平性”等关键属性时,相关标准定义模糊、主观性强,导致不同测试之间难以横向比较。

为此,研究团队呼吁全球AI社区共同推动建立开放、透明且标准化的评估框架,制定通用的最佳实践指南,以增强AI安全测试的可靠性与可重复性,从而真正保障技术发展的稳健与可信。

以上就是数百项 AI 安全测试存在严重缺陷的详细内容,更多请关注其它相关文章!


# 互联网  # 网站建设公司 临沂  # 黄冈网站app推广下载官网  # 营销推广简历优缺点  # 新浦营销推广费用  # SEO的含义和象征  # 原神推广视频官方网站在哪  # 优化汽车网站排名  # 唐山网站优化机构  # 蓬莱智能营销推广定制  # 搜索运营和seo  # 是在  # 计算机  # 牛津  # 年中  # 之父  # 英国政府  # 百项  # 欧洲  # 微软  # 押注  # ai  # 谷歌  # 人工智能 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: ChatGPT设计出的第一个机器人来了!【附人工智能行业预测】  谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型  生成式人工智能进入产业应用!但再“聪明”仍是工具,最终目的是服务于人  商汤科技:元萝卜 AI 下棋机器人新品发布会 6 月 14 日举行  人工智能时代的科幻译者怎么办?“做好翻译工作的高端10%”|文化观察  深企派遣无人机救援队赴京津冀开展防汛救灾任务  世界人工智能大会机器人同台炫技!梳理A股相关业务营收占比超50%的个股名单  自然语言生成在智能家居设备中的应用  AI 大模型重塑软件开发,有哪些落地前景和痛点?| ArchSummit  南京制造的国产工业机器人:在外资品牌竞争中突围,年销售1.8万台  Midjourney创始人:AI应该成为人类思想的延伸  特斯拉 Optimus 人形机器人入驻北美门店,帮助提升汽车销量  谷歌推出 AI 反洗钱工具,可将金融机构内部风险预警准确率提高2至4倍  AI浪潮席卷,时空壶为何能成为AI翻译时代的破局者  爱设计 AI 一键生成 PPT 工具上线:输入标题即可生成 PPT  美妆行业在AI时代蓬勃发展  数据科学,解码智能未来——Altair首次提出“Frictionless AI”概念  对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型  华为昇腾AI原生支持30多种基础大模型,包括GPT  阿里云推出通义万相AI绘画大模型  跑不动的元宇宙,虚拟世界比现实更冷酷  报告称 70% 程序员已使用各种 AI 工具编程  万魔推出AI主攻的运动耳机,开启十年研发新纪元  小米9号员工李明宣布创业:打造首款安卓桌面机器人  AI新视野,增长新势能,伙伴云受邀出席笔记侠创业讲真话AI峰会  Valve Index VR 头显销量下滑,上市四年的长青树渐失光彩  人工智能大胆预测:银河系至少有2万个地球,36种外星文明  小米又拿下国际比赛第一:AI翻译立功  腾讯TRS之元学习与跨域推荐的工业实战  “直击”AI新世界,智能机器人再次“火出圈”了  调查显示:实际上没有那么多人在用 ChatGPT  李开复:未来几年,人工智能会革了所有人的命,除非你这么做  谷歌计划在上海举办开发者大会,重点关注机器学习和生成式AI领域  杀入生成式AI的亚马逊云科技,能否再次生成未来?  天翼云在国际AI顶会大模型挑战赛中获得冠军  参议院司法听证会:AI 不易管控,有可能被恶意分子利用来研发生化武器  马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧  人工智能行业急缺人 AI人才年薪能达近42万元  WHEE安装教程  OpenAI CEO 阿尔特曼到访日本,对全球 AI 协调合作表示乐观  AMD称下半年AI显卡供应充足,不需要像NVIDIA那样加价抢购  腾讯AI首次模拟拼接三星堆文物,工作取得阶段性的成果  亚太地区 70% 的企业高管正探索生成式 AI 应用或已经进行投资  人工智能赋能无人驾驶:商业化进程再提速  第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》  字节团队提出猞猁Lynx模型:多模态LLMs理解认知生成类榜单SoTA  消息称 ChatGPT 未来有望增加更多功能:上传文件分析信息,还能记住用户画像  当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来  第四范式「式说」大模型入选《2025年通用人工智能创新应用案例集》  Nature封面:量子计算机离实际应用还有两年 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司