第 004 期

3 月 26 日 AI 要闻:规则公开、安全赏金与开发者实时知识同时前移

OpenAI 公开 Model Spec 的更新方法,推出面向 AI 风险的 Safety Bug Bounty,并发布青少年安全政策;Google DeepMind 则用 agent skills 把 Gemini API 编码任务成功率从 28.2% 拉到 96.6%。

新闻日期:3月26日星期四 · 发布时间:2026-03-27 07:30(北京时间)

Google DeepMind 关于 agent skills 的文章横幅图。
第003期3 月 26 日 AI 要闻:规则公开、安全赏金与开发者实时知识同时前移03/26
01 模型治理 4 分钟

OpenAI 公开 Model Spec 的更新方法,把模型行为规则推到台前

OpenAI 解释 Model Spec 的结构、目标与公开迭代方式,试图让模型默认行为变得更可读、也更可讨论。

OpenAI Model Spec 官方艺术卡片。
规则公开OpenAI 公开 Model Spec 的更新方法,把模型行为规则推到台前01

OpenAI 在 2026 年 3 月 25 日发布《Inside our approach to the Model Spec》,专门说明它如何撰写和更新 Model Spec。官方把这份文档定位为描述“模型预期行为”的活文档,目标受众不仅是内部团队,也包括用户、开发者、研究者和政策制定者。文章还把这套规范拆成 Objectives、Rules、Defaults、Chain of Command 和 Specification 五层结构,强调模型行为并不是只能在训练细节里被动体现,也应该被公开表述。

要点

  • OpenAI 正把模型默认行为从内部经验转成可阅读、可持续修订的公开规范。
  • Model Spec 被明确区分于使用政策和产品级防护,说明“模型该怎么回答”正在被单独治理。
  • 把规范写出来本身就是一种产品动作,因为它会影响用户对模型可控性和可信度的判断。

为什么值得关注

当模型能力越来越接近时,行为规则、默认取向和更新透明度会成为新的差异化层。对开发者和企业来说,能否读懂模型的默认边界,往往比一条跑分更直接地影响选型。

来源

02 安全与评测 4 分钟

OpenAI 启动 Safety Bug Bounty,把 AI 滥用与代理风险纳入公开赏金

这项新计划与传统 Security Bug Bounty 分开运行,重点鼓励外部研究者提交 AI 滥用、连接器和代理执行相关的安全问题。

OpenAI Safety Bug Bounty 官方艺术卡片。
安全赏金OpenAI 启动 Safety Bug Bounty,把 AI 滥用与代理风险纳入公开赏金04

同样在 2026 年 3 月 25 日,OpenAI 宣布与 Bugcrowd 合作推出 Safety Bug Bounty。官方强调,这不是传统安全漏洞赏金的简单翻版,而是单独面向 AI 使用风险的新入口。当前公开示例包括:模型协助利用漏洞、代理在网站或用户上下文中执行有害操作、由代理式使用带来的账户和平台完整性问题,以及 MCP 或连接型应用里的 prompt injection 与数据外泄风险。相比只统计越权和远程执行,这一计划更贴近 AI 时代实际会出现的“模型做错事”场景。

要点

  • OpenAI 开始把 AI 安全问题单独归类,而不再完全附着在传统网络安全流程上。
  • 连接器、MCP 和代理执行被写进赏金计划,说明厂商已经把外部工具调用视为高风险区。
  • 安全研究的价值正在从“能否越权”扩展到“模型会不会在合法权限里做出高伤害动作”。

为什么值得关注

一旦 AI 产品进入浏览器、企业系统和真实工作流,安全问题就不再只靠内部红队解决。公开赏金计划意味着平台必须为外部安全研究留出正式接口,这会逐渐变成代理产品的基础设施。

来源

03 开发者工具 4 分钟

Google DeepMind 用 agent skills 给编码代理补实时知识,Gemini API 任务成功率跃升

Google DeepMind 公开 Gemini API developer skill,把最新文档和 SDK 指南塞进代理工作流,相关评测成功率从 28.2% 提高到 96.6%。

Google DeepMind agent skills 文章横幅图。
Agent SkillsGoogle DeepMind 用 agent skills 给编码代理补实时知识,Gemini API 任务成功率跃升03

Google Developers Blog 在 2026 年 3 月 25 日发布《Closing the knowledge gap with agent skills》。文中把问题说得很直接:LLM 的知识是静态的,但 SDK、最佳实践和 API 入口每天都在变。Google DeepMind 为此做了一个 Gemini API developer skill,把最新模型、各语言 SDK、示例代码和文档入口作为“权威来源”提供给代理。在官方披露的评测中,gemini-3.1-pro-preview 在接入这套 skill 后,任务成功率从 28.2% 升到 96.6%。

要点

  • 与其只训练更大的基础模型,Google 展示了如何用轻量技能层补上“知识过时”这一工程短板。
  • 把文档入口明确写进代理工作流,意味着开发者工具正从检索增强走向更可维护的技能化封装。
  • 成功率的跃升也提醒开发者,很多所谓模型问题,其实是上下文和最新资料没有被喂进去。

为什么值得关注

开发者最真实的痛点往往不是模型不会写代码,而是它不知道最新 SDK 长什么样。agent skills 这类做法如果跑通,下一阶段竞争就会从“谁更聪明”转向“谁更懂当下的真实文档和工作流”。

来源

04 安全部署 3 分钟

OpenAI 发布面向青少年的提示式安全政策,给安全模型补上可执行规则

这套新政策与 gpt-oss-safeguard 配合使用,初始覆盖暴力、性内容、危险挑战、身体形象和高风险角色扮演等场景。

OpenAI 面向青少年的安全策略与 gpt-oss-safeguard 工作流示意图。
青少年安全OpenAI 发布面向青少年的提示式安全政策,给安全模型补上可执行规则04

OpenAI 在 2026 年 3 月 24 日发布《Helping developers build safer AI experiences for teens》,把青少年安全从抽象原则继续往部署细节推进。官方推出的是一组可直接调用的 prompt-based safety policies,目标是帮助开发者为青少年用户建立更符合年龄的输出边界。这些政策与开放权重安全模型 gpt-oss-safeguard 搭配使用,并在 Common Sense Media、everyone.ai 以及 ROOST 等外部组织参与下整理出首批重点类别,包括暴力、性内容、危险活动、身体形象和浪漫或暴力角色扮演。

要点

  • OpenAI 正把安全治理做成可复用的部署素材,而不仅是高层原则和红队报告。
  • 将政策与开放权重安全模型打包,能降低教育、社交和青少年产品的接入门槛。
  • 外部儿童安全与教育组织被纳入流程,说明这类安全控制正在走向更细分的场景治理。

为什么值得关注

AI 产品进入教育和青少年场景后,部署方真正需要的不是一句“注意安全”,而是可编辑、可组合、能接进现有系统的具体控制层。谁先把这些控制层产品化,谁就更容易进入高敏感行业。

来源

补充快讯

适合快速扫读的补充动态与行业信号

行为规则

OpenAI 把 Model Spec 的公开写作流程拆开解释,明确区分模型行为规范、使用政策和产品级防护。

安全赏金

Safety Bug Bounty 不只看传统漏洞,也开始把 prompt injection、连接器误用和高风险代理行为纳入外部提交流程。

青少年保护

面向青少年场景的提示式安全政策与 gpt-oss-safeguard 绑定,初始覆盖暴力、性内容、危险挑战和角色扮演等类别。

实时知识

Google DeepMind 的 Gemini API developer skill 让代理直接拿到最新文档,相关编码任务成功率从 28.2% 升至 96.6%。

编辑判断

这一轮竞争正在从模型能力延伸到默认行为、外部审计和部署素材,真正值得追踪的是产品化深度。

来源分布

覆盖中英文主流信源,统一整理为中文脉络

OpenAI

英文 · 国际

1 条引用

OpenAI Model Spec

英文 · 国际

1 条引用

Alignment OpenAI

英文 · 国际

1 条引用

OpenAI Safety

英文 · 国际

4 条引用

Bugcrowd

英文 · 国际

1 条引用

Google Developers Blog

英文 · 国际

1 条引用

Google AI for Developers 中文文档

中文 · 中国

1 条引用

Google AI for Developers

英文 · 国际

1 条引用

GitHub

英文 · 国际

1 条引用

Hugging Face

英文 · 国际

1 条引用

前后期回看

相邻期数

第 003 期

3月25日星期三

3 月 25 日 AI 要闻:音乐生成进入产品栈,模型行为与安全机制同步公开

Google 把 Lyria 3 推进 Gemini API、AI Studio、Vertex AI、Google Vids 和 Gemini app;OpenAI 则同日公开解读 Model Spec,并上线面向 AI 滥用风险的 Safety Bug Bounty。

  • Google 推出 Lyria 3 Pro,把三分钟音乐生成直接铺进 Vertex AI、Google Vids 和 Gemini app
  • Google 向开发者开放 Lyria 3 公开预览,Gemini API 与 AI Studio 一起补齐音乐生成入口
  • OpenAI 详解 Model Spec,把模型该如何服从指令与处理冲突写成公开框架
阅读本期

第 002 期

3月24日星期二

3 月 24 日 AI 要闻:ChatGPT 试水商品发现,AI 入口与基础设施同步外扩

OpenAI 把商品发现与比价直接带进 ChatGPT,Arm 发布面向 agentic AI 云时代的 AGI CPU,Google TV 新增 3 项 Gemini 功能,NVIDIA 则把 GPU 动态资源分配驱动捐给 Kubernetes 社区。

  • OpenAI 为 ChatGPT 加入商品发现与比价界面,聊天产品开始更像购物入口
  • Arm 发布 AGI CPU,直接把 agentic AI 云时代写成自家芯片叙事
  • Google TV 将新增 3 项 Gemini 功能,客厅大屏也开始承接生成式 AI 入口
阅读本期