3 月 26 日 AI 要闻：规则公开、安全赏金与开发者实时知识同时前移

编者手记

这期最值得注意的，不是又多了一个模型名，而是头部公司开始把长期隐性的能力做成显性的产品层资产：模型行为该如何定义、风险该如何被外部发现、开发者如何拿到最新知识，都在 3 月下旬被更明确地公开出来。

本期看点

01 OpenAI 公开 Model Spec 的更新方法，把模型行为规则推到台前
02 OpenAI 启动 Safety Bug Bounty，把 AI 滥用与代理风险纳入公开赏金
03 Google DeepMind 用 agent skills 给编码代理补实时知识，Gemini API 任务成功率跃升
04 OpenAI 发布面向青少年的提示式安全政策，给安全模型补上可执行规则

01 模型治理 4 分钟

OpenAI 公开 Model Spec 的更新方法，把模型行为规则推到台前

OpenAI 解释 Model Spec 的结构、目标与公开迭代方式，试图让模型默认行为变得更可读、也更可讨论。

OpenAI Model Spec 官方艺术卡片。 — 规则公开OpenAI 公开 Model Spec 的更新方法，把模型行为规则推到台前01

OpenAI 在 2026 年 3 月 25 日发布《Inside our approach to the Model Spec》，专门说明它如何撰写和更新 Model Spec。官方把这份文档定位为描述“模型预期行为”的活文档，目标受众不仅是内部团队，也包括用户、开发者、研究者和政策制定者。文章还把这套规范拆成 Objectives、Rules、Defaults、Chain of Command 和 Specification 五层结构，强调模型行为并不是只能在训练细节里被动体现，也应该被公开表述。

要点

OpenAI 正把模型默认行为从内部经验转成可阅读、可持续修订的公开规范。
Model Spec 被明确区分于使用政策和产品级防护，说明“模型该怎么回答”正在被单独治理。
把规范写出来本身就是一种产品动作，因为它会影响用户对模型可控性和可信度的判断。

为什么值得关注

当模型能力越来越接近时，行为规则、默认取向和更新透明度会成为新的差异化层。对开发者和企业来说，能否读懂模型的默认边界，往往比一条跑分更直接地影响选型。

来源

02 安全与评测 4 分钟

OpenAI 启动 Safety Bug Bounty，把 AI 滥用与代理风险纳入公开赏金

这项新计划与传统 Security Bug Bounty 分开运行，重点鼓励外部研究者提交 AI 滥用、连接器和代理执行相关的安全问题。

OpenAI Safety Bug Bounty 官方艺术卡片。 — 安全赏金OpenAI 启动 Safety Bug Bounty，把 AI 滥用与代理风险纳入公开赏金04

同样在 2026 年 3 月 25 日，OpenAI 宣布与 Bugcrowd 合作推出 Safety Bug Bounty。官方强调，这不是传统安全漏洞赏金的简单翻版，而是单独面向 AI 使用风险的新入口。当前公开示例包括：模型协助利用漏洞、代理在网站或用户上下文中执行有害操作、由代理式使用带来的账户和平台完整性问题，以及 MCP 或连接型应用里的 prompt injection 与数据外泄风险。相比只统计越权和远程执行，这一计划更贴近 AI 时代实际会出现的“模型做错事”场景。

要点

OpenAI 开始把 AI 安全问题单独归类，而不再完全附着在传统网络安全流程上。
连接器、MCP 和代理执行被写进赏金计划，说明厂商已经把外部工具调用视为高风险区。
安全研究的价值正在从“能否越权”扩展到“模型会不会在合法权限里做出高伤害动作”。

为什么值得关注

一旦 AI 产品进入浏览器、企业系统和真实工作流，安全问题就不再只靠内部红队解决。公开赏金计划意味着平台必须为外部安全研究留出正式接口，这会逐渐变成代理产品的基础设施。

来源

OpenAI Safety 英文
OpenAI Safety 英文
Bugcrowd 英文

03 开发者工具 4 分钟

Google DeepMind 用 agent skills 给编码代理补实时知识，Gemini API 任务成功率跃升

Google DeepMind 公开 Gemini API developer skill，把最新文档和 SDK 指南塞进代理工作流，相关评测成功率从 28.2% 提高到 96.6%。

Google DeepMind agent skills 文章横幅图。 — Agent SkillsGoogle DeepMind 用 agent skills 给编码代理补实时知识，Gemini API 任务成功率跃升03

Google Developers Blog 在 2026 年 3 月 25 日发布《Closing the knowledge gap with agent skills》。文中把问题说得很直接：LLM 的知识是静态的，但 SDK、最佳实践和 API 入口每天都在变。Google DeepMind 为此做了一个 Gemini API developer skill，把最新模型、各语言 SDK、示例代码和文档入口作为“权威来源”提供给代理。在官方披露的评测中，gemini-3.1-pro-preview 在接入这套 skill 后，任务成功率从 28.2% 升到 96.6%。

要点

与其只训练更大的基础模型，Google 展示了如何用轻量技能层补上“知识过时”这一工程短板。
把文档入口明确写进代理工作流，意味着开发者工具正从检索增强走向更可维护的技能化封装。
成功率的跃升也提醒开发者，很多所谓模型问题，其实是上下文和最新资料没有被喂进去。

为什么值得关注

开发者最真实的痛点往往不是模型不会写代码，而是它不知道最新 SDK 长什么样。agent skills 这类做法如果跑通，下一阶段竞争就会从“谁更聪明”转向“谁更懂当下的真实文档和工作流”。

来源

04 安全部署 3 分钟

OpenAI 发布面向青少年的提示式安全政策，给安全模型补上可执行规则

这套新政策与 gpt-oss-safeguard 配合使用，初始覆盖暴力、性内容、危险挑战、身体形象和高风险角色扮演等场景。

OpenAI 面向青少年的安全策略与 gpt-oss-safeguard 工作流示意图。 — 青少年安全OpenAI 发布面向青少年的提示式安全政策，给安全模型补上可执行规则04

OpenAI 在 2026 年 3 月 24 日发布《Helping developers build safer AI experiences for teens》，把青少年安全从抽象原则继续往部署细节推进。官方推出的是一组可直接调用的 prompt-based safety policies，目标是帮助开发者为青少年用户建立更符合年龄的输出边界。这些政策与开放权重安全模型 gpt-oss-safeguard 搭配使用，并在 Common Sense Media、everyone.ai 以及 ROOST 等外部组织参与下整理出首批重点类别，包括暴力、性内容、危险活动、身体形象和浪漫或暴力角色扮演。

要点

OpenAI 正把安全治理做成可复用的部署素材，而不仅是高层原则和红队报告。
将政策与开放权重安全模型打包，能降低教育、社交和青少年产品的接入门槛。
外部儿童安全与教育组织被纳入流程，说明这类安全控制正在走向更细分的场景治理。

为什么值得关注

AI 产品进入教育和青少年场景后，部署方真正需要的不是一句“注意安全”，而是可编辑、可组合、能接进现有系统的具体控制层。谁先把这些控制层产品化，谁就更容易进入高敏感行业。

来源

OpenAI Safety 英文
OpenAI Safety 英文
GitHub 英文
Hugging Face 英文

补充快讯

适合快速扫读的补充动态与行业信号

行为规则

OpenAI 把 Model Spec 的公开写作流程拆开解释，明确区分模型行为规范、使用政策和产品级防护。

安全赏金

Safety Bug Bounty 不只看传统漏洞，也开始把 prompt injection、连接器误用和高风险代理行为纳入外部提交流程。

青少年保护

面向青少年场景的提示式安全政策与 gpt-oss-safeguard 绑定，初始覆盖暴力、性内容、危险挑战和角色扮演等类别。

实时知识

Google DeepMind 的 Gemini API developer skill 让代理直接拿到最新文档，相关编码任务成功率从 28.2% 升至 96.6%。

编辑判断

这一轮竞争正在从模型能力延伸到默认行为、外部审计和部署素材，真正值得追踪的是产品化深度。

来源分布

覆盖中英文主流信源，统一整理为中文脉络

OpenAI

英文 · 国际

1 条引用

OpenAI Model Spec

英文 · 国际

1 条引用

Alignment OpenAI

英文 · 国际

1 条引用

OpenAI Safety

英文 · 国际

4 条引用

Bugcrowd

英文 · 国际

1 条引用

Google Developers Blog

英文 · 国际

1 条引用

Google AI for Developers 中文文档

中文 · 中国

1 条引用

Google AI for Developers

英文 · 国际

1 条引用

GitHub

英文 · 国际

1 条引用

Hugging Face

英文 · 国际

1 条引用

前后期回看

相邻期数

第 003 期

3月25日星期三

3 月 25 日 AI 要闻：音乐生成进入产品栈，模型行为与安全机制同步公开

Google 把 Lyria 3 推进 Gemini API、AI Studio、Vertex AI、Google Vids 和 Gemini app；OpenAI 则同日公开解读 Model Spec，并上线面向 AI 滥用风险的 Safety Bug Bounty。

Google 推出 Lyria 3 Pro，把三分钟音乐生成直接铺进 Vertex AI、Google Vids 和 Gemini app
Google 向开发者开放 Lyria 3 公开预览，Gemini API 与 AI Studio 一起补齐音乐生成入口
OpenAI 详解 Model Spec，把模型该如何服从指令与处理冲突写成公开框架

阅读本期

第 002 期

3月24日星期二

3 月 24 日 AI 要闻：ChatGPT 试水商品发现，AI 入口与基础设施同步外扩

OpenAI 把商品发现与比价直接带进 ChatGPT，Arm 发布面向 agentic AI 云时代的 AGI CPU，Google TV 新增 3 项 Gemini 功能，NVIDIA 则把 GPU 动态资源分配驱动捐给 Kubernetes 社区。

OpenAI 为 ChatGPT 加入商品发现与比价界面，聊天产品开始更像购物入口
Arm 发布 AGI CPU，直接把 agentic AI 云时代写成自家芯片叙事
Google TV 将新增 3 项 Gemini 功能，客厅大屏也开始承接生成式 AI 入口

阅读本期