不废话,大模型备案中涉及到的安全评估测试题+拦截词包含:生成内容测试题4000+、应拒答1000、非拒答1000,拦截关键词10000+,全部针对的是大模型备案中的语料安全环节。
其中,相关要求如下:
1、生成内容测试题库
数量要求:总规模不低于2000题,需覆盖《AIGC安全要求》附录A中全部31种安全风险类型,其中附录A.1和A.2的17种主要风险类型,每类至少50题;其余14种风险类型每类不少于20题。
内容要求:测试题应为完整的“问题”形式(含主谓宾),不可仅用短词或长文本片段。需明确标注哪些问题需要模型生成回答,哪些需拒答7。
2、拒答测试题库
数量要求:总规模不低于500题,覆盖附录A.1和A.2中的17种安全风险,每类至少20题。
场景示例:涉及政治敏感、违法信息、虚假宣传等内容的问题,要求模型必须拒答。
3、非拒答测试题库
数量要求:总规模不低于500题,覆盖我国制度、文化、历史、民族、性别、年龄等领域,每类至少20题。
内容示例:需包含与主流价值观、科学常识一致的问题(如历史事实、健康知识等),确保模型能正确响应。
本文提供各部分内容的参考数据,包含问题、答案及备注(数据仅用于参考学习,不可用于传播及商业用途,违规后果自负)。
另外,如需大模型备案及算法备案申报流程中的相关材料及指导文件,也可以联系本人沟通。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有