一、LEOPARD2024介绍
前列腺癌是一种常见的恶性肿瘤,每年影响 140 万男性。这些患者中有相当一部分接受前列腺切除术作为主要治愈性治疗。该手术的疗效部分通过监测血液中的前列腺特异性抗原 (PSA) 浓度来评估。虽然 PSA 在前列腺癌筛查中的作用尚有争议,但它是患者前列腺切除术后随访的宝贵生物标志物。手术成功后,PSA 浓度通常在 4-6 周内检测不到(<0.1 ng/mL)。然而,大约 30% 的患者会出现生化复发,这意味着前列腺癌细胞复发。这种复发可作为临床转移进展和最终前列腺癌相关死亡的预后指标。
当前的临床实践通过考虑国际泌尿病理学会 (ISUP) 分级、诊断时的PSA值和TNM分期标准来衡量生化复发的风险。欧洲共识指南建议根据这些因素将患者分为低风险、中等风险和高风险组。值得注意的是,高 ISUP 等级会将患者独立归类为中风险组 (2/3 级) 或高风险组 (4/5 级)。
格里森生长模式代表前列腺癌的形态模式,用于将癌组织分为 ISUP 等级组。然而,ISUP 等级有局限性,例如病理学家之间的分级分歧和组织形态的粗略描述。
最近,深度学习被证明能够预测前列腺癌的生化复发。挑战赛的目标是产生性能最佳的深度学习解决方案,以根据 H&E 染色的组织病理组织切片(即基于形态特征)预测生化复发时间。
二、LEOPARD2024任务
估算生化复发的时间(以年为单位,作为连续变量,例如 1.23 年或 17.68 年)。
三、LEOPARD2024数据集
训练集包含来自 Radboudumc 的 508 个病例,每个病例对应一位独特的患者。每个病例都是一个前列腺切除术的 WSI,包含癌症,形式为锥体 TIF,这是一种多分辨率平铺格式。每个分辨率都作为 TIF 中的单独级别存储。第一级包含全分辨率图像。每个后续级别都是前一个级别的四倍下采样。大多数 WSI 由多个幻灯片打包在一起组成,如下所示。
除WSI外,还提供了一个triending_labels.csv文件,其中包含患者的后续信息:case_id(str) - 每个患者的唯一标识符;Event(int) - 患者是否患有生化复发(0 =否,1 =是);Follow_UP_YEARS(float) - 时间是生化复发的时间(事件= 1)或年度的最后一次随访(事件= 0)。
验证集由大约150名患者组成。验证图像仅在运行时容器中可访问。
测试组包括约650名患者。测试图像也只能在运行时容器中访问。这个更大的评估集将在预测未见数据的生化复发时间时对模型的性能进行全面评估。
数据下载:
https://leopard.grand-challenge.org/data-download/
评价指标:根据审查的一致性指数评估性能。一致性指数定义为所有比对的比例,其中预测和结果是一致的。
四、技术路线
WSI数据是图像金字塔结构构成的,为了对整个图像进行分析,根据WSI的元信息中得到金字塔个数,并选择中间层金字塔图像为输出做为是否生化复发和生化复发时间预测的图像输入。
任务一、是否生化复发二分类
1、将图像缩放到固定大小2048x2048,然后采用均值为0,方差为1的方式进行归一化处理,再将数据分成训练集和验证集。
2、搭建ResNet2d网络,使用AdamW优化器,学习率是0.001,batchsize是4,epoch是300,损失函数采用交叉熵。
3、训练结果和验证结果
4、验证集分类结果
任务二、生化复发时间预测
1、将图像缩放到固定大小2048x2048,然后采用均值为0,方差为1的方式进行归一化处理,再将数据分成训练集和验证集。
2、搭建ResNet2d网络,使用AdamW优化器,学习率是0.001,batchsize是4,epoch是1000,损失函数采用MSE。
3、训练结果和验证结果
4、验证集预测结果
R-squared score: 0.838
MAE: 0.86