内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险

内部文件曝光:Meta严防员工使用Claude	、Codex,防范知识蒸馏风险-第1张图片

  元平台(Meta)正逐步减少对 Anthropic、OpenAI 旗下高价 AI 代码工具的依赖 ,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识 。

内部文件曝光:Meta严防员工使用Claude、Codex	,防范知识蒸馏风险-第2张图片

  科技媒体《The Information》获取的 Meta 内部管理规范文件显示,公司对应用 AI 工程部门的工程师使用 Anthropic 旗下 Claude 代码工具 、OpenAI 旗下 Codex 模型设置了严格使用限制。一份内部备忘录甚至要求团队暂停部分依托这两款模型开展的工作,原因是担心第三方模型的输出内容可能混入 Meta 的模型训练数据 ,文件警告 ,该行为或将引发 “与合作企业之间严重的升级纠纷”。

内部文件曝光:Meta严防员工使用Claude、Codex,防范知识蒸馏风险-第3张图片

  背景详情

  Meta 是 Claude 代码工具的大客户之一,今年初公司组建应用 AI 工程团队 ,核心任务是迭代自研代码助手 MetaCode(前身为 DevMate),其中关键工作就是搭建高质量数据集、设计编程测试题库,用于训练 、评测自研代码大模型 。虽然公司允许团队在部分场景使用第三方 AI 工具 ,但明确要求:测试题库必须由工程师自主设计,依托自身专业技术完成,不得直接使用 AI 生成的思路方案。

  这份 5 月出台 、目前仍在生效的内部规范显示 ,Meta 惧怕无意间触发知识蒸馏行为 —— 也就是借助竞品模型的输出结果来训练自家 AI 模型,该操作涉嫌违反 Claude、Codex 的用户使用协议。

  知识蒸馏本质上是开发者直接复用其他企业在数据、算力 、研发上的巨额投入来训练自有模型,近些年该行为的合规争议持续发酵 。

  去年 ,深度求索(DeepSeek)推出高性能大模型后引发行业热议,OpenAI 曾质疑该模型部分能力源自对其 o1 模型的知识蒸馏(深度求索后续回应称,模型预训练主要采用公开数据与经授权的第三方合规数据) 。就在今年 4 月埃隆・马斯克起诉 OpenAI 的庭审中 ,马斯克旗下太空探索技术公司(SpaceX)的 AI 子公司 xAI 被迫承认 ,曾对 OpenAI 的模型开展过部分知识蒸馏。

  今年 2 月,Anthropic 表示,在监测到多家中国 AI 企业大规模开展模型蒸馏后 ,公司投入大量技术手段搭建防护机制;本月,该企业指控中国电商企业阿里巴巴实施了迄今为止规模最大的 Claude 模型蒸馏攻击。在提交给美国国会的信函中,Anthropic 称此次攻击瞄准了 Claude 最核心的前沿能力 ,包括智能体推理、软件工程、长周期复杂任务处理等,阿里巴巴暂未对此置评 。

  OpenAI 、Anthropic、谷歌的 AI 模型用户协议均明确禁止:利用模型输出内容研发同类竞争产品。

  Meta 内部文件并未出现员工违反上述协议的具体案例。Meta 官方发言人回应:“我们制定了清晰的 AI 工具使用规范,引导团队合规使用工具 ,聚焦高价值研发工作 。 ”

  尽管暂无违规案例,但这份最新约束规范足以说明:在全力迭代 AI 产品、为巨额算力硬件投入寻求商业回报的关键阶段,管理层必须给员工划定清晰的使用红线。

  全力压降 AI 研发成本

  随着 AI 相关开支急速膨胀 ,减少外部 AI 工具依赖 、将大量研发工作迁移至自研工具 MetaCode 已经成为 Meta 的核心战略。根据公司近期内部备忘录,Meta 仅今年内部 AI 使用相关支出就将达到数十亿美元 。在全公司大范围推广 AI 工具之后,Meta 如今通过限制员工的令牌(Token)调用额度 ,遏制成本失控上涨的趋势。

  公司允许应用 AI 工程团队在常规工作中使用第三方 AI 工具 ,例如搭建工作流、整理代码与文件、为自研 AI 工具开发自动化校验类测试基础设施,也就是规范中提到的测试脚手架搭建 、方案参数校准(用于搭建、调优模型性能评测体系)。

  即便在上述合规场景下,所有 AI 生成内容投入使用前必须经过人工严格审核 。规范明令禁止:使用外部 AI 模型的输出来设计代码测试题库 ,文件中写道 “该行为意味着工程师完全丧失项目主导权,我们绝不允许测试任务的创意来源于第三方模型”。

  另一项禁令:工程师不得借助 AI 查找源代码漏洞,也不能通过代码分析让 AI 产出测试任务方向。简单来说 ,不能由 AI 来决定需要测试哪些业务问题 。

  此外,规范要求:如果自研待测模型可以访问容器内资源,那么应用部署容器(封装程序、代码 、依赖库等运行环境)中 ,严禁放入任何 AI 生成内容 。

  在合规边缘谨慎前行

  业内专家表示,科技企业在研发过程中使用竞品 AI 模型,相当于走钢丝:既要借力第三方模型提升效率 ,又要严防相关数据回流进自家的训练体系。

  法学与科技行业顾问马克・莱泽评价,Meta 这份内部文件几乎完整还原了企业游走在合规红线的所有风控细节。

  尽管美国现行法律并未明令禁止知识蒸馏,AI 生成内容也不受版权法保护 ,但各大 AI 实验室普遍会直接封禁涉嫌蒸馏的企业 、个人的模型调用权限 。

  去年 ,Anthropic 就关停了 OpenAI 调用 Claude 的 API 接口权限。OpenAI 当时解释,调用接口仅用于横向测评竞品模型的能力与安全性能,属于行业通用的技术基准测试手段。

  Meta 上月的备忘录提及 ,部分员工利用 AI 生成、修改评测任务,导致无法界定任务创意来自人工还是第三方模型 。

  Meta 收紧 Claude、Codex 使用权限,一方面是担忧第三方模型输出内容间接流入训练数据集 ,既会损害自研模型质量,也会引发合作方的合规纠纷;另一方面,通过暂停相关高危业务强化内部治理 ,让 AI 研究院 、应用 AI 业务线管理层确保所有研发流程符合合规要求。

文章推荐

  • 隔壁出现疫情/隔壁栋有人确诊了怎么办

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 疫情塑身衣/疫情 衣服

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 【沂水疫情分布,沂水疫情分布在哪里】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    0
  • 【邳州疫情查询,邳州疫情查询电话】

      元平台(Meta)正逐步减少对Anthropic、OpenAI旗下高价AI代码工具的依赖,自主研发替代工具,但眼下遭遇一大难题:如何避免工程师过度依赖第三方工具,导致自研过程涉嫌窃取竞品模型知识。  科技媒体《TheInformation》获取的Meta内部管理规范文件显示,公...

    2026年06月30日
    1