1.大模型上线备案表
相当于模型的“身份证’包含模型名称、所属企业、调用方式、使用范围、适用人群、使用场景等基础信息。各省网信办都有模板
2.安全评估报告
最核心的一份材料,要认真准备,至少六七十页,甚至上百页。
重点要从以下几个维度说明:模型能力是否可控,是否支持拒答是否容易被诱导输出违法违规内容是否对图片/文本内容进行安全拦截训练语料来源是否合规,个人隐私保护
3.模型服务协议
就是用户使用你模型时必须同意的协议(如用户协议、隐私政策)内容要涵盖用户使用范围、禁止事项模型生成内容的免责声明数据采集及使用声明用户信息处理规则
4.语料标注规则
模型训练用的数据是怎么处理的?对原始语料(如文本、图片、语音、视频等)中需要被机器学习识别和理解的内容,你是怎么标注的。把人工或自动标记的规范说明写清楚。
5.拦截关键词列表
在模型输入输出层设置敏感词拦截,如果触发,模型应该拒答。
6.评估测试题集
自评过程的测试题和结果记录这一部分用于证明你的模型回答“稳不稳”设定一批测试问题(覆盖常见、边缘、敏感场景)记录模型答复内容判断是否合规、是否存在输出风险
1.企业主动向属地网信办报备要去网信办现场面谈模型情况,拿到纸质备案表;
2.撰写备案资料,开展安全自评估填写备案表、安全评估报告、语料标准规则等;
3.准备大模型测试账号准备给网信办老师的测试账号;
4.全部材料提交属地网信办,审核约45个工作日全套材料和测试账号给到网信办审核,可能会有4-6次不能意见反馈,根据反馈意见进行材料修改;
5.中央网信办材料复核与技术评审中央审核,如果没通过就继续修改材料;
6.备案通过,下发备案号等网信办发布公告,一般3个月左右公式一批。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。