中国针对大模型(如生成式AI、大语言模型等)的备案政策主要依据《生成式人工智能服务管理暂行办法》(以下简称《办法》)及相关法规,旨在规范技术研发和应用保障数据安全与用户使用权益。
根据《办法》,以下情况需要进行大模型备案:
①自主研发大模型、有语料具备舆论属性与社会动员能力的、需要备案。
②调用第三方模型基座、有舆论属于与社会动员能力、并进行微调、有语料的需要备案。
③第三方基座没有微调、训练、没有语料的只需要做大模型登记。
主要针对生成式人工智能(AIGC)产品,如大语言模型、深度合成模型,能够生成文本、图片、视频等内容的。
提供具有舆论属性及社会动员能力的生成式AI服务与企业或机构。
●招投标、融资
●合法合规
●地区奖励
●便于当地政府监管
●大模型备案表:相当于“身份证”,写清楚模型的基本信息。
●安全评估报告:这是最核心的材料,要详细说明模型的安全性,至少三十页噢(具体看模型情况)。
●模型服务协议:用于使用模型时必须同意的协议,涵盖使用范围、数据处理等内容。
●语料标注规则:说明训练数据的处理规范,标注要清晰。
●拦截关键词列表:设置敏感词拦截,确保模型输出合规。
●评估测试题集:记录模型对各种问题的回答,证明它的稳定性。
备案虽然复杂,但按着这个攻略一步步来,一定能顺利通过的。
①首先要预约属地网信办预约进行线下领表,要带上自己的产品,网信办会当场对产品进行测试,测试通过后会下发大模型上线备案表。
②认真撰写材料,材料分别有五部份,分别有:安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题集等材料。
③网信办要求提供测试账号,并打印纸质版材料。
④网信办通知专家召开专家评审会(一对多)。
⑤通过专家评审会议后、网信办的测试产品群无反馈意见、纸质版材料无需修改,即等待网信办通知备案通过。
大模型备案周期大概6~8个月左右,具体要看网信办的情况;产品要求主要是:产品开发基本完成(有内测),需要提供账号,对成熟和稳定的要求高。
审核材料的真实性,模型的安全性(看是否有涉黄、涉爆、涉赌等违规),非法信息拦截有效性,并进行技术测试。
语料来源的安全性
境外语料不得超过总语料的30%,自采语料需要提供采集证明,商业语料需要提供购买协议。
测试题质量
测试题直接影响评估的有效性和可靠性。
法律责任
未备案或提供虚假材料将面临警告,通报批评,责令限期改正;拒不改正或情节严重的,责令暂停提供相关服务。
①大模型备案是APP上架、进入市场、参加政府采购的必备资质。
②备案号可以提升用户对产品安全性的信任、提升企业在AI领域的影响力。
③通过备案,企业可获得监管部门的专业反馈,推动模型的优化与发展。
④备案通过了可以申请领取地方奖励、深圳、广州地区目前最高100万元。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。