点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:刘奕群:没有科学评测,大模型安全治理无从谈起
首页> 时政频道> 国内 > 正文

刘奕群:没有科学评测,大模型安全治理无从谈起

来源:光明网2026-04-14 23:37

  光明网香港4月14日电(记者 孔繁鑫)4月14日,2026年世界互联网大会亚太峰会人工智能安全治理论坛在中国香港举行。会上,清华大学计算机系教授、科研院院长、技术转移院院长、互联网司法研究院院长刘奕群表示,安全需要被精准度量,没有科学严谨的评测机制,人工智能大模型安全治理便无从谈起。他提出,要以场景化测试赋能人工智能安全,以“评测即治理”的思路破解大模型安全治理难题。

刘奕群:没有科学评测,大模型安全治理无从谈起

清华大学计算机系教授、科研院院长、技术转移院院长、互联网司法研究院院长刘奕群。光明网记者 潘迪、赵金悦/摄

  刘奕群认为,当前,大模型已从单一文本生成工具,演变为具备强大多模态处理与工具使用能力的通用认知智能体,深度融入社会生产生活全流程,但其安全风险也呈现泛化趋势,突破了传统信息安全范畴,向认知结构与价值判断深层渗透。而当前国内外主流大模型安全评测多依赖于静态测试题库,存在四大核心缺陷:评估目标错位、评估工具失准、风险表达隐蔽、语言识别浅表化,既难以适配本土价值体系与复杂语境,也无法触及深层语义陷阱。

  针对这一行业痛点,刘奕群介绍,清华大学联合中关村国家实验室打造场景化测试总体框架,划定12个核心评测维度,覆盖社会主流价值、文化传承与创新、社会公平与正义三大方向,构建648个细分测试点,实现测试题动态自动生成、回答结果全自动化评测。

  刘奕群提到,基于该框架的测试,揭示了当前中国大模型的核心安全短板:行业在文化传承创新维度表现普遍不佳;对社会公平正义的认知存在偏差;同时,90%的模型在非中文语境下安全得分断崖式下降,暴露出深层价值观与跨语言对齐的脆弱性。

[ 责编:董大正 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2026年世界青年发展论坛在武汉开幕

  • 我国夏粮小麦收获已近九成

独家策划

推荐阅读
山西省运城市盐湖区持续加大对盐湖的生态保护力度,实施退盐还湖、生态修复、提升水质等工程,盐湖生态环境显著改善
2026-06-16 14:29
2026年6月是第25个全国“安全生产月”,主题为“人人讲安全、个个会应急——排查整治风险隐患”。
2026-06-16 14:24
大西高铁山西省运城市夏县水头镇沿线向日葵花开正艳,飞驰的高速列车在金色的花海之中穿行,澄澈蓝天、金色向日葵花与疾驰列车相映成趣
2026-06-16 13:57
山东省临沂市平邑县平邑街道,农民晾晒收获的小麦
2026-06-16 13:53
广西桂林市阳朔县白沙镇燕湖景美如画,游客乘船欣赏秀美的山水田园风光
2026-06-16 13:39