暂无搜索历史
解密prompt24. RLHF新方案之训练策略:SLIC-HF & DPO & RRHF & RSO
上一章我们主要聊聊RAG场景下的幻觉检测和解决方案,这一章我们单独针对大模型的幻觉问题,从幻觉类型,幻觉来源,幻觉检测,幻觉缓解这四个方向进行整理。这里就不细说...
暂未填写公司和职称