
昨天接到一位客户的咨询,说他们的模型还在开发阶段,想提前了解一下大模型备案政策中对于模型训练语料有什么具体要求,提前规避一下。客户确实有前瞻性,考虑得比较充分。训练语料在研发阶段至关重要,直接影响模型的性能、安全性和合规性。
严格规避《生成式人工智能服务安全基本要求》定义的 5 类 31 种不良语料
检查方式:违法不良信息占比需≤5%,人工抽检≥1000 条且合格率≥95%
大模型备案的语料管理需贯穿 “采集 - 标注 - 过滤 - 审计” 全流程,核心是确保数据来源合法、处理规范、风险可控。同时关注后续法规政策更新,确保持续符合监管要求。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。