首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

蚂蚁集团开源首个医疗专科推理数据集,覆盖 97.6% 泌尿就医人群

IT之家 12 月 28 日消息,蚂蚁集团今日宣布开源首个医疗专科推理数据集。该数据集由训练、验证、测试三部分组成,包含 2132 个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了 97.6% 以上的泌尿科就医人群,号称能“真实复刻诊疗场景”。

在医疗行业,通用型语言模型在应对医疗问诊时,会直接给出答案,而医生则会根据专业知识进行反复的症状探讨,才能给出答案。此外,大模型的幻觉问题和推理能力不足,当前高质量的中文医学专科数据集又较为稀缺,这对训练出色的医疗领域大模型提出了挑战。

据介绍,为克服这些难题,蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的方式,推出了中文医疗专科问答推理数据集 RJUA-QA,这也是业内首个临床专科数据集。

专业性上,由于医疗行业有超百个科室,每个专科和疾病,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗数据集的构建与开放。

IT之家查询发现,RJUA-QA 已在 GitHub 上开源,README 页面显示“本数据集的病例数据由专业医生的根据临床经验编写而成,因此不涉及任何医患个人隐私”。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O9mEljdiCt8l99OyGcDk7x7w0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券