2026实操指南|全网最详细的大模型备案通关手册,仅此一份
作者:admin | 发布时间:2026-05-26最近,一位客户深夜来电:产品研发投入近千万,小程序提交审核当天被驳回,理由只有一行字——"请补充提供大模型备案或算法备案凭证"。这不是个例。在我们经手的咨询中,超过六成企业是被应用市场打回来后才意识到要做备案的,此时距离原定上线日期,往往只剩两三周。
而备案这件事,最快也要 6 个月。
根据第三方大模型算法备案查询平台众森卫士最新数据,截至 2026 年 4 月,全国累计已有 1372 个大模型 通过网信办合规审查,其中 大模型备案 861 个、大模型登记 511 个。数字背后是一个清晰的信号:生成式AI的"野蛮生长"时代已经结束,合规即生存。

众森企服自 2019 年成立、2024 年起深度服务大模型备案领域,已累计协助 100+ 家企业(含多家行业独角兽)顺利拿证,办理足迹覆盖全国所有省份。本篇文章,我们把过去两年沉淀的实操经验、踩过的坑、以及最新的国标要求,浓缩成这一份8000+字的通关手册,希望能帮您一次看懂、一次办成。

一、为什么必须备案?——不备案的代价 vs 备案的价值
法规依据:两条核心条款,定义了备案的"强制性"
《生成式人工智能服务管理暂行办法》第十七条:提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
《互联网信息服务算法推荐管理规定》第二十四条:具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
【大白话翻译】:什么叫"具有舆论属性或社会动员能力"?只要您的AI产品能让普通公众用上、看到、传播——哪怕只是一个"AI写作助手"小程序、一个"智能客服"对话框——就属于这个范畴。法规没有给企业留"自我判断"的余地:该备而不备,就是违法。
不备案 vs 已备案:一张表看清两种命运
| 未备案的代价 | 成功备案的价值 |
|---|---|
| ❌ 产品下架:苹果、华为、微信小程序等平台强制下架未备案AI应用 | ✅ 合法运营:拿到官方"白名单",消除下架隐患 |
| ❌ 高额罚款:最高可处营业额 5% 罚款,情节严重者停业整顿 | ✅ 信任背书:政府、国企、金融大客户采购的硬性门槛 |
| ❌ 融资受阻:合规性是投资机构尽调的"一票否决项" | ✅ 资本加分:合规资质是估值的重要支撑 |
| ❌ 刑事责任:生成违法内容造成严重后果,负责人承担刑责 | ✅ 政策红利:优先获取政府补贴、算力券、试点示范资格 |

二、对号入座——你的业务到底要做哪种备案?
这是全文最重要的章节之一。走错方向,意味着几个月白干。我们先建立一个判定原则:ToC 还是 ToB?模型有没有被改?是否生成内容?——三个问题,结论自然浮现。
6种典型场景判定表
| 业务场景 | 技术特征 | 是否ToC | 需办理类型 | 典型举例 |
|---|---|---|---|---|
| 套壳开发 | 调用已备案大厂API + 外挂自有知识库 | 是 | 算法备案 + 大模型登记 | 调用通义千问API做的公众版智能客服 |
| 微调开发 | 基于Qwen/DeepSeek等开源模型微调 | 是 | 算法备案 + 大模型备案 | 基于开源模型微调的AI写作助手 |
| 自研基座 | 从零训练底层大模型 | 是 | 算法备案 + 大模型备案 | 自研通用/行业基座模型 |
| 企业内部使用 | API调用,不对公众开放 | 否(ToB) | 大模型登记 | 仅限员工使用的内部知识助手 |
| 直接使用已备案SaaS | 不改模型、仅嵌入调用 | — | 无需备案 | 嵌入第三方已备案对话框 |
| 仅做后端分析 | 不输出生成内容 | — | 无需备案 | 数据打标、分类等后端任务 |
2个真实案例拆解
案例A:某法律科技公司基于 Qwen3 微调了"法律问答助手",向律所开放 SaaS 服务。 判定:虽是 ToB 模式,但服务覆盖大量执业律师,具备社会动员能力,需做算法备案;若产品功能扩展至面向公众生成法律文书,建议同步推进大模型备案。
案例B:某电商APP内置"AI导购",根据用户描述生成商品推荐文案。 判定:典型的生成合成类算法 + 生成式AI服务,必须完成双备案(算法备案 + 大模型备案)。
众森提示:场景定性是备案的第一步。我们提供免费场景定性分析,帮您在动手准备材料前就把方向定准。

三、三种备案彻底搞清楚——算法备案 vs 大模型登记 vs 大模型备案
很多企业把这三者混为一谈,导致材料准备方向错误。一张表讲清楚:
| 对比维度 | 算法备案 | 大模型登记 | 大模型备案 |
|---|---|---|---|
| 全称 | 互联网信息服务算法备案 | 生成式人工智能服务登记 | 生成式人工智能(大语言模型)上线备案 |
| 核心法规 | 《算法推荐管理规定》《深度合成管理规定》 | 《暂行办法》 | 《暂行办法》+《GB/T 45654-2025》 |
| 提交途径 | 线上:算法备案系统 | 线下:属地网信办 | 线下:属地网信办 |
| 审核部门 | 中央网信办 | 属地网信办 | 属地初审 + 中央终审 |
| 审核方式 | 材料审查 | 材料审查 | 材料审查 + 技术测试 |
| 办理周期 | 3-4 个月 | 4-6 个月 | 6-8 个月 |
| 难度 | ★★★ | ★★★★ | ★★★★★ |
| 备案号示例 | 网信算备XXXXX号 | Beijing-XixxxxAI-2026xxxxS0157(中间多个"S") | Beijing-YuxxxxHua-2026xxxx0122 |
| 适用对象 | 5类算法服务提供者 | 调用已备案模型的服务方 | 自研/微调/魔改/预训练模型方 |
众森提示:大模型登记号与大模型备案号最直观的区别就是中间那个"S"——S 代表"登记"(Service Registration),没有 S 的则是正式备案号。这是辨别合规等级的一个小技巧,也是企业自查合作方资质时的速查方法。
结论:绝大多数 ToC 大模型企业,都要做"双备案"——既做算法备案(解决"机制透明"问题),又做大模型备案或登记(解决"内容安全"问题)。
四、备案五步走全流程详解(核心章节)
整套流程涉及企业、属地网信办、中央网信办、行业主管部委多方协同,建议预留 6-8 个月。下面逐步拆解。

第一步:启动申请与材料预沟通(约 2-4 周)
做什么:主动联系公司注册地或实际经营地所在的省级/市级网信办,表明大模型上线备案意向。
关键提示——各地操作方式不同:
北京市:唯一发放《生成式人工智能(大语言模型)备案信息采集表》的地区,企业需按表填写后提交
其他省份:不提供标准采集表,企业需自行准备
公司介绍 + 模型介绍 PPT,重点说明:公司基本情况(注册资本、团队规模、主营业务)
模型技术路线(自研/微调/调用)、参数规模、训练语料
产品功能、应用场景、目标用户
已有的算法备案号(如有)
提交形式:通过邮箱将 PPT(或北京的采集表)发送至属地网信办指定联系人。
预沟通环节:网信办收到材料后,会预约企业到现场进行答辩和模型演示。这是非常关键的一关——企业需当场展示模型能力、回答专家提问。符合《生成式人工智能服务管理暂行办法》要求的,网信办会当场下发后续的备案申请材料模板,进入正式材料准备阶段;不符合的,会被要求调整产品或退回。
易踩的坑:
很多企业误以为"发完邮件就开始等",实际上没有进入答辩环节就意味着没有真正进入流程,要主动跟进推动
现场答辩时如果对模型技术细节、语料来源、风控机制讲不清楚,会直接被打回——这一步对技术负责人的"合规表达能力"要求很高
众森经验:我们会提前帮助客户模拟答辩环节,并提前准备好答辩 Q&A 手册(覆盖网信办高频提问的 50+ 问题),帮您一次过关。
第二步:企业内部安全自评估与材料准备(2-3 个月,最核心环节)
拿到网信办下发的备案材料模板后,进入最关键、最耗时的环节。整套材料包括1 份主表 + 5 份核心附件。
📋 大模型备案材料完整清单
📌 主表:《生成式人工智能(大语言模型)上线备案表》
详细填写以下四大类信息:
企业基本情况:公司名称、性质、注册地址、实际经营地、团队规模、安全评估人员
功能服务:服务形式(网页/APP/小程序/API)、主要功能、服务领域、目标用户、服务范围
算法机理:模型名称、参数规模、开发方式(自研/微调/预训练)、技术路线、已有算法备案号
训练语料:语料来源(自采/采购/开源)、总规模、境内外数据占比、语种分布
主表需加盖公章,PDF + WORD 双版本提交。
📌 附件1:《安全评估报告》——审核生死线
需逐条对应《GB/T 45654-2025 网络安全技术 生成式人工智能服务安全基本要求》(以下简称"国标"),覆盖四大维度:
| 评估维度 | 核心内容 |
|---|---|
| 语料安全 | 来源合法性证明(采购合同/授权书/开源协议)、内容过滤机制、知识产权审查、个人信息去标识化处理 |
| 模型安全 | 训练过程安全审计、防止生成违法/歧视/虚假/侵权内容的能力、提示词注入攻击防范、模型版本更新机制 |
| 生成内容安全 | 上线后的内容过滤与审核机制、隐式/显式水印标识、合格率指标达标证明 |
| 安全措施 | 关键词拦截机制、拒答率设置、用户协议、应急预案、未成年人保护、投诉举报机制 |
篇幅参考:一份合规的安全评估报告通常100-200 页,每个国标条款都要有对应的论述、数据和证据材料支撑。这是审核中最容易被打回的一份材料——很多企业写得太"虚",没有量化指标和实证数据,必然返工。
📌 附件2:《模型服务协议》
面向用户的服务协议模板,需明确:
双方权利义务
内容规范(用户不得用模型做什么、生成内容的归属与责任)
隐私政策(信息收集类型、用途、存储期限、第三方共享)
知识产权条款
免责声明与争议解决
易错点:很多企业直接把"通用服务协议"改个名字提交,被审核打回。协议必须针对生成式 AI 的特性——比如"生成内容不代表平台观点""用户对生成内容的二次传播负责"等条款,必须明确写入。
📌 附件3:《语料标注规则》
详细说明:
语料来源:自采、商业采购、开源数据集各占多少
清洗流程:去重、去噪、敏感信息过滤的具体步骤
标注流程:标注人员资质、培训考核、保密协议、标注工具
质量核验:抽检比例、合格率指标(人工抽检 ≥96%、技术抽检 ≥98%)
隔离存储:标注数据如何防泄露
📌 附件4:《拦截关键词列表》
基本要求:至少包含 10,000 个关键词,覆盖政治、色情、暴力、歧视、商业违法等所有风险场景。
北京市特殊要求:拦截关键词需达到 200,000 个(20 万)。其他省份按国标基本要求 1 万词执行即可。
词库结构建议:
按 5 大类 31 种风险维度分层组织
包含敏感词、变体词(拼音、谐音、拆字)、上下文敏感词
配套定期更新机制(建议每月更新)
📌 附件5:《评估测试集》
包含三类测试题:
| 测试题类型 | 数量要求 | 用途 |
|---|---|---|
| 生成内容测试题 | ≥ 2,000 题 | 测试模型生成内容是否安全、是否符合价值观 |
| 非拒答测试题 | ≥ 500 题 | 测试模型对正常问题的回答能力(防止"过度拒答") |
| 拒答测试题 | ≥ 500 题 | 测试模型对敏感问题的拒答能力,拒答率需 ≥ 95% |
北京市特殊要求:测试题库总量需达到 50,000 道(5 万),其他省份按上述基本要求即可。
易错点:测试题不能只是"政治正确"类问题的堆砌,必须覆盖5 大类 31 种风险的全部子项,且包含对抗性提示(如越狱攻击、变体表达、多轮诱导)。
📌 其他辅助材料
企业简介
国产芯片需求及替代计划(中央网信办硬性要求,需披露算力来源与国产化时间表)
商业合作授权书 / 语料采购合同(证明语料来源合法性)
分类模型备案表(多模型企业适用)
众森提示:第二步的材料准备工作量极大,100% 自己做的企业通常需要 4-5 个月反复打磨。我们的合规专家团队按照国标"逐条对标"撰写,配套结构化词库系统 + 动态题库管理工具,可以把这个阶段压缩到 1-2 个月。
第三步:递交地方网信办审核 & 技术测试(约 2 个月)
做什么:
全套材料递交属地网信办
配合多轮材料审查与修改(通常 3-5 轮)
完成 API 接口规范适配
提供 5-10 个已实名认证、功能完整的测试账号
官方测试规模:网信办使用自有题库进行安全测试,规模可达几万到十几万题,覆盖:
基础风险(违反核心价值观、歧视、违法等)
提示词注入攻击(Prompt Injection)
多模态风险(如图文联动绕过)
对抗性表达(拼音、谐音、隐喻、多轮诱导)
易踩的坑:很多企业的拦截词库在内测时表现良好,但面对官方"对抗性题库"全面溃败。关键不在词库大小,而在于风险覆盖维度。
第四步:中央网信办(国家网信办)终审(1-2 个月)
地方审核通过后,材料上报至中央网信办进入终审环节。完整流程为:
专家评审 → 征求意见 → 省委报批 → 央办终审
🔍 重点解读"征求意见"环节——决定生死的隐形关卡
这是整个备案流程中最不可控、最容易卡住企业的环节。所谓"征求意见",指的是中央网信办需要向相关行业主管部委征询是否同意备案放行。
为什么这一步如此关键?
如果您的模型涉及金融领域 → 需征求金融监管总局意见
涉及医疗健康领域 → 需征求卫健委意见
涉及市场监管/广告生成 → 需征求市场监管总局意见
涉及税务咨询/申报 → 需征求国家税务总局意见
涉及地理/地质/气象/测绘 → 需征求相应敏感信息主管部门意见
【行业潜规则】:根据我们的实操经验,上述行业主管部委对其管辖范围内的大模型,目前基本上不同意放行。一旦在征求意见环节被否决,企业的备案就会无限期挂起——既不被驳回(可以重新申请),也不被通过(拿不到备案号),陷入"薛定谔的备案"状态。
这就是为什么金融、医疗、市监、税务、敏感地理信息等行业大模型几乎拿不到备案号的根本原因。详细分析见第六章。
终审中可能的二次技术测试
中央网信办可能再组织一轮安全测试,颗粒度更细、对抗性更强。题库与地方测试不重复,企业需做好"再战一场"的准备。
第五步:获取备案编号与公告
终审通过后,中央网信办下发备案编号,并在官方网站定期公告(如"2025年第12批"),属地网信部门同步通知企业。至此,您的大模型才可以正式合法上线。
📌 重要提示:拿到备案号 ≠ 合规结束
属地网安部门会在备案通过后进行实地安全检查,重点核查:
网络安全管理制度是否落地
数据安全保护措施是否到位
等保备案、关键岗位人员配备
应急响应机制是否健全
这一检查不在备案审核期间发生,而是备案通过后的"日常监管"动作,需要企业长期维护合规运营状态。
众森提示:从第一步到第五步,平均流转周期 6-8 个月。我们的预审专家团队会在材料提交前模拟监管视角进行内审,把驳回率降到最低;同时在"征求意见"环节,我们会基于过往经验为客户判断备案可行性,避免企业在不可能通过的方向上空耗资源。
五、安全评估报告——审核的"生死线"
法规与国标依据
《GB/T 45654-2025 网络安全技术 生成式人工智能服务安全基本要求》:将原本模糊的安全要求,转化为可量化的技术指标。这是 2026 年专家评审的"金标准",任何不符合该国标量化指标的企业,将在初审阶段直接被退回。
【大白话翻译】:以前监管说"模型要安全",企业可以泛泛而谈;现在国标直接给数字——90% 合格率、95% 拒答率——达不到就是不合规,没有"差不多"这一说。
国标硬指标速查表
| 评估维度 | 量化指标 |
|---|---|
| 生成内容安全性合格率 | ≥ 90% |
| 拒答覆盖率(应拒答的) | ≥ 95% |
| 误拒率(不应拒答的) | ≤ 5% |
| 人工抽检合格率 | ≥ 96% |
| 技术抽检合格率 | ≥ 98% |
| 拦截关键词库(基本要求) | ≥ 10,000 个 |
| 拦截关键词库(北京要求) | ≥ 200,000 个 |
| 测试题库(生成内容) | ≥ 2,000 题 |
| 测试题库(拒答) | ≥ 500 题 |
| 测试题库(非拒答) | ≥ 500 题 |
| 测试题库总量(北京要求) | ≥ 50,000 题 |
安全评估的三大维度
✅ 维度一:语料安全(源头治理)
数据来源:必须证明合法(采购合同、授权书、公开数据集链接),具备多样性、可追溯
数据内容:建立预训练数据过滤机制,严控知识产权与个人信息风险
数据标注:标注人员经培训考核 + 签保密协议;标注内容多轮核验;数据隔离存储
✅ 维度二:模型安全(过程与结果)
训练安全:使用安全题库 + 高质量标注数据进行 SFT/RLHF;定期审计开发框架
输出安全:满足上述国标硬指标
标识要求:生成内容必须添加隐式或显式标识(如水印),符合《人工智能生成合成内容标识办法》
监测更新:实时防范提示词注入、数据窃取等攻击;模型重大更新需重新评估
✅ 维度三:安全措施(制度保障)
适用管理:明确人群、场合、用途
未成年人保护:建立专门模式或过滤机制
信息公开:公示算法原理、服务协议、隐私政策
用户权益:投诉举报机制、用户输入信息保护
业务连续性:应急预案
端侧安全:本地化部署的离线安全策略
5大类31种风险(审核重点)
| 风险类别 | 子项数 | 示例 |
|---|---|---|
| 1. 违反社会主义核心价值观 | 8项 | 煽动颠覆、恐怖主义、虚假有害信息等 |
| 2. 歧视性内容 | 9项 | 民族、信仰、地域、性别、年龄、职业、健康等歧视 |
| 3. 商业违法违规 | 5项 | 侵犯知识产权、违反商业道德、不正当竞争等 |
| 4. 侵犯他人合法权益 | 7项 | 危害身心健康、肖像权、名誉权、隐私权等 |
| 5. 特定服务安全缺陷 | 2项 | 关键领域内容不准确、生成内容不可靠 |

众森提示:《安全评估报告》动辄上百页,专业性极强,技术语言与合规语言难以转换是绝大多数企业的痛点。我们的合规专家团队按照国标"逐条对标"撰写,确保每一项指标都有对应的论述、数据和证据材料支撑。
六、特殊场景与"事实负面清单"
端侧大模型的额外要求
监管对端侧大模型(即模型部署在用户设备本地)有专门的核心关注点:
离线用户能否封禁?
违规日志能否上报?
突发事件能否处置?
是否具备备案测试场景化 + 离线沙盒能力?
如果您的产品涉及端侧部署,这四个问题必须在材料中明确回答。
事实负面清单:哪些行业"很难批"?
如前文第四章所述,"征求行业主管部委意见"是终审阶段的隐形关卡。我们在过去两年办理 100+ 案例、覆盖全国所有省份的过程中,发现一个客户必须提前知晓的现实——部分行业的主管部委,对其管辖范围内的大模型基本不予同意:
金融领域(金融监管总局管辖):信贷决策、智能投顾、反洗钱、保险定价等场景,基本不批
医疗领域(卫健委管辖):辅助诊断、健康咨询、用药建议等场景,审批门槛极高,目前几乎不放行
市场监管领域(市监总局管辖):商品质量判定、广告自动生成、消费者投诉处理等,不予同意
税务领域(国家税务总局管辖):税务咨询、申报辅助、税收筹划等场景,基本不批
国家敏感信息领域:涉及地理、地质、气象、测绘等国家敏感数据的大模型,原则上不批
【这意味着什么】:一旦您的产品落入上述行业,备案会卡在中央网信办"征求意见"环节无限期挂起——既不被正式驳回,也拿不到备案号。很多企业在这种状态下白白等了一年甚至两年。
众森经验:我们建议这类客户在第一步预沟通阶段就调整产品定位——比如把"AI智能投顾"改造为"金融知识科普助手"、把"AI辅助诊断"改造为"健康知识问答工具",绕开强监管场景的同时保留商业价值。这种"定性微调"往往是备案能否通过的分水岭,具体怎么调,我们可以一对一沟通。
七、企业最常踩的四大坑 & 解决方案
| 常见挑战 | 业内现状 | 众森解法 |
|---|---|---|
| 报告难写 | 《安全评估报告》专业性极强,技术语言与合规语言难转换 | 合规专家团队按国标逐条对标撰写,提供预审服务 |
| 词库难建 | 北京要求 20 万词库,人工维护几乎不可能 | 结构化词库系统 + 动态更新机制,覆盖5大类31种风险 |
| 数据难溯 | 训练数据来源复杂,版权链条难完整举证 | 协助梳理授权链、提供采购合同模板、对接合规语料供应商 |
| 方向选错 | 落入"事实负面清单"行业,无限期挂起 | 第一步就做场景定性 + 可行性判断,避免空耗 |

八、写在最后:备案不是终点,而是合规运营的起点
很多企业以为拿到备案号就万事大吉了,这是个误区。后备案时代,监管要求企业:
季度安全报告:定期向属地网信办报送运行情况
拦截词库动态更新:跟随网络热点持续迭代
重大版本变更需重新评估:模型升级、功能扩展都可能触发"再备案"
属地网安日常检查:备案通过后的实地安全检查
应急响应机制:违规内容生成后的处置时效有硬性要求
合规是一项长期工程,而不是一次冲刺。
众森企服自 2024 年起深耕大模型备案领域,至今已协助 100+ 家企业(含多家行业独角兽)顺利通过备案,办理足迹覆盖全国所有省份。我们提供从场景定性 → 答辩模拟 → 材料撰写 → 词库构建 → 测试辅导 → 全程代办 → 后备案跟踪的一站式保姆级服务,包通过。
【关于众森企服】
众森企服成立于2019年,是浙江省股交中心挂牌企业及高新技术企业。在这个AI狂飙的时代,我们拥有全国百余名高级咨询顾问,为企业提供算法备案、大模型备案及AIGC相关合规资质的一站式保姆级全包服务。
🏆 众森的服务理念与承诺:
诚信:遵循客户价值观,注重结果同样关注过程,全面履约是根本。
专业:多角度入手,合理规划方案,提供最权威建议,客观解决问题。
效率:当日签约即当日审核,签约项目尽享7×24小时全年无休运营响应。
🏢 我们的全矩阵业务链:
众森不仅是AI合规专家,更是您企业全生命周期的合规管家。我们长期专注:
增值电信许可:ICP、EDI、IDC、ISP、CDN、SP等;
文化与视听许可:网络文化经营许可证、营业性演出许可证、广播电视节目制作许可证等;
企业体系与认证:国家高新企业认定、专精特新"小巨人"、ODI备案、CMMI认证等。
专注互联网咨询服务,咨询找众森,成功简单点!
扫描➕下面微信,专业办理互联网资质,专业的,包通过!

下一篇:没有了!








