理解标注变异性的来源对开发公平的NLP系统至关重要,尤其在性别歧视检测等涉及人口偏见的问题中。本研究通过广义线性混合模型量化标注者人口特征与文本内容对标注决策的影响,发现人口因素仅占方差变异的8%,文本内容仍是主导因素。进一步评估生成式AI(GenAI)模型作为标注工具的可靠性,发现简单的人口角色提示往往无法提升甚至可能降低其与人类判断的一致性。可解释AI(XAI)技术显示,模型预测主要依赖与性别歧视相关的内容特征词,而非人口特征关联词。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。