前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NC:预测阿尔茨海默病的个体进展轨迹

NC:预测阿尔茨海默病的个体进展轨迹

原创
作者头像
悦影科技
发布2023-06-25 08:24:24
7700
发布2023-06-25 08:24:24
举报
文章被收录于专栏:脑电信号科研科普

1. 摘要

对阿尔茨海默病(AD)进展的预期对于评估二级预防措施是至关重要的,因其被认为可以改变疾病的发展轨迹。然而,很难预测AD的自然进展,特别是不同的功能在不同的年龄下降,不同患者的发生率不同。我们在这里评估了AD进程映射,这是一个统计模型,根据当前疾病早期阶段的医学和放射学数据,预测患者的神经心理评估和成像生物标志物的进展。我们对96000多例患者进行了该方法的测试,其中包括来自四大洲的4600多名患者。我们测量了方法准确性通过选择了在一个假设的试验中显示临床端点进展的被试。我们发现,使用预测进展者丰富人群可以使所需的样本量减少38%至50%,这取决于试验时间、结果和目标疾病阶段,从无症状的AD风险个体到早期和轻度AD被试。我们表明,该方法没有引入关于性别或地理位置的偏差,并且对缺失的数据是稳健的。它在疾病的早期阶段表现最好,因此非常适合用于预防试验。

2. 引言

到目前为止,神经退行性疾病的药物开发成本最高,其失败率无与伦比。在这方面,美国食品和药物管理局(FDA)于2021年6月7日批准了阿度卡努单抗,这代表了阿尔茨海默病(AD)药物开发的一个转折点。这一决定提出了一个关键的问题,即证明一种化合物作用于一个关键的生物过程的临床益处,即大脑中淀粉样斑块的积累。

目前还不清楚为什么对这种关键的生物学机制的有效干预与较低水平的认知衰退只有微弱的关联。很可能是其核心的生物过程及其相互作用尚未被完全了解。另一种非排他性的解释是,必须更精确地解决治疗谁和何时治疗的问题,以证明临床疗效。2019年,卡明斯和他的同事已经强调了改进临床试验的必要性,通过在正确的试验中以正确的生物标志物针对正确的被试。这里的动机很简单:如果预计该端点在试验期间不会恶化,就不可能表明一种候选疗法能减缓端点的退化。如果在疾病进展之前包括被试,如果没有干预会导致端点的显著变化,治疗效果规模将会更大。这样的目标周期取决于所选择的端点来证明疗效。

特别很难为AD这样的疾病确定最合适的时间框架,它经过几十年的时间,以非线性的方式发展,并且在患者之间有不同的临床表现。目前用于主要生物标志物和临床端点的阈值对于选择具有同质进展谱的患者群体还不够有效。疾病建模使用计算和统计方法来解决这个问题。这些模型从观察性纵向队列数据中学习疾病进展的可变性,然后可以从其历史数据中预测患者的进展。它们需要在一个或几个时间点进行各种临床或生物标志物评估作为输入。这些技术已开始用于临床试验设计。例如,一项回顾性分析显示,通过针对在试验开始时预测的进展类型的被试,可以增加治疗的效果大小。其他研究表明,预测端点的价值可能使减少临床试验的样本量成为可能。

我们在这里提出了一个软件工具,使用疾病进展模型,以在临床试验中选择被试。其目标是丰富可能在试验过程中显示出进展的选定被试群体,这一概念被FDA称为预后富集,并且已经应用于一些AD试验中。我们将使用AD进程映射作为疾病进展模型。这是一个非线性混合效应模型,它同时预测该疾病的进展动态和疾病的临床表现。在TADPOLE的框架中,该技术优于56种预测认知能力下降的替代方法。我们将把这个模型与RNN-AD进行比较,RNN-AD是一种递归神经网络,即一种学习时间动态行为的深度学习方法。2020年6月,它在TADPOLE的认知能力下降预测方面排名第二。

我们将首先评估该模型预测当前临床试验中使用的主要端点进展的能力。我们将使用5个独立的数据集,数据来自四大洲的4600多名患者。我们将分析这些算法的系统偏差,它们对缺失数据的稳健性,以及跨国家、种族和疾病阶段的推广的适用性。最后,我们将通过改变几个关键参数来模拟临床试验的纳入程序:所选择的结果、试验持续时间和选择标准。最后,我们将表明,被预测有结果恶化风险的被试构成了一个可能对治疗表现出更大和更同质的反应的人群。

3. 结果

3.1 研究人群的特征

我们使用了来自4687名被试的数据五纵向多中心队列从北美、澳大利亚、日本和欧洲:阿尔茨海默病神经成像计划(ADNI)(N=1652),澳大利亚成像、生物标志物和生活方式旗舰研究老化(AIBL)(N=460),日本阿尔茨海默病神经成像计划(J-ADNI)(N=470),PharmaCog队列(N=111)和MEMENTO队列(N=1994)。

表1和表2总结了每个数据集的特征。这些数据集包含来自不同种族、遗传和地理背景的不同患者资料,并在不同的疾病阶段进行随访。所有这些研究的神经心理检查均按照国际标准进行,图像采集程序也按照ADNI联盟建立的方案进行。因此,这些数据集一起对应于一个相关的患者池,用于模拟一个典型的大型多中心III期试验的纳入程序。

表1. 研究被试的特征

表2. 研究被试的端点分布

3.2 疾病进展模型学习在疾病进展过程中生物标志物水平变化的时间

我们使用具有已证实的病理淀粉样蛋白水平的ADNI被试作为训练集(N = 866)来训练疾病进展模型,并使用基线和所有可用的随访数据。我们保留了来自其他ADNI被试和四个外部队列成员的数据作为验证集(N = 3821)。对AD课程地图和RNN-AD使用了相同的模型训练和验证协议。

两个模型包括以下端点:小型精神状态检查(MMSE),阿尔茨海默病评估量表认知子13项(ADAS-Cog13),临床痴呆评级的盒子(CDR-SB),左右海马和侧脑室,Aβ1-42和p-tau181水平在脑脊液(脑脊液),淀粉样蛋白的标准吸收值比(SUVR)和Tau-PET扫描。

AD进程映射假设这些端点在疾病进展过程中遵循一个逻辑进展曲线,在拐点处有不同的进展率和年龄。它学习了如何通过改变进展和疾病表现的动态(即给定疾病阶段端点的相对值)来调整这组逻辑曲线以拟合个体数据。相比之下,RNN-AD学习了在给定时间点的值下,端点的值将如何变化。假设1个月的过渡是一个端点的当前值和当前诊断的非线性函数(例如一个神经网络)。

3.3 疾病进展模型预测了认知能力的下降

疾病进展模型从一次或几次访问中从相关被试收集的数据中预测生物标志物变化的特定轨迹。预测的轨迹用于预测未来时间点的生物标记物的值。图1说明了这个预测过程。

图1. 疾病进展模型从一个被试的历史数据中预测了端点的进展。在这个简化的例子中,该模型只有三个端点(淀粉样蛋白PET、海马体积和微型精神状态检查(MMSE))。该被试在70岁和71岁时被观察过两次(彩色十字架)。将数据归一化到0-1尺度(0为最正常,1为最大病理变化)后,该模型预测被试特定的进展曲线。从这些曲线中,我们可以预测4年时间内三个端点的值(彩色点)。如本例所示,AD课程地图不需要计算缺失的数据。在试验模拟中,这些曲线是从单个时间点的数据中预测出来的,例如基线。

我们反复评估了AD课程Map和RNN-AD在预测验证集被试的认知端点(ADAS-Cog13、MMSE和CDR-SB)方面的错误。我们对被试的最新访问进行了盲法,并试图从非盲法数据中预测他们。从ADAS-Cog13的44,435个预测(MMSE的96,970个,CDR-SB的96,849个)中,我们确定了预测结果和实际结果之间的绝对差异,作为被试的特征和用于预测目的的信息函数。

图2显示了根据共同创建因素调整后的AD课程地图和RNN-AD的平均绝对误差(MAE)的分布。报告错误的参考被试参考预测设计:一个75岁的美国女性ADNI组平均教育水平,没有APOE-ε4突变,和A+ T + N +状态可疑痴呆,我们预测神经心理评估在三年的时间,基于过去两次访问间隔8个月没有缺失的数据。广告课程地图产生的平均绝对误差5.98(95%可信区间= [5.44,6.48])的85ADAS-Cog13,2.54(95%可信区间= [2.39,2.71])的MMSE 30,和1.86(95%可信区间= [1.75,1.99])的CDR-SB。

图2. AD进程映射比其他方法更能更好地预测认知能力下降。平均绝对误差报告参考被试:一个75岁的美国女性从ADNI平均教育水平,没有APOE- ε4突变,和A+T+N+C~状态(即CDR全球0.5),我们预测神经心理评估在三年的时间,基于过去两次访问隔八个月,所有的数据是可用的。箱形图表示中位数,第一和第三个四分位数;须表示经验的95%置信区间。

在所有情况下,AD进程映射和RNN-AD产生的误差明显小于两种替代方法:无变化预测(预测与被试上次访问时获得的值相同)和线性混合效应模型(p < 0.01)。这两种替代方案被证明是短期进展的良好预测指标,主要是因为该疾病的总体进展速度较慢。深度学习方法RNN-AD产生了中等性能,DAS-Cog13、MMSE和CDR-SB的预测的绝对误差分别为6.53(95% CI = [6.02,7.19])、2.75(95% CI = [2.57,2.92])和1.95(95% CI = [1.81,2.09])。

我们调查了不同类别的被试和预测设计的ADAS-Cog 13评分的MAE变化(图3)。对于AD进程映射,之前考虑的访问次数(1、2或3)对预测误差没有显著影响。相比之下,每增加预测一年的时间,ADAS-Cog13评分的MAE就增加0.80(95% CI = [0.71,0.93])。性别和APOE基因型的预测没有显著影响,但对年龄高于平均水平、受教育时间较长的参与者的预测略有改善。平均而言,来自PharmaCog队列的欧洲被试和来自J-ADNI队列的日本被试的预测比来自ADNI队列的美国被试的预测分别好约1.1和0.6分。对缺失脑脊液或Tau PET数据的预测很稳健,当MRI或淀粉样PET缺失时,预测略有恶化,MAE的差异分别为0.27(95% CI = [0.00,0.55])和0.54(95% CI = [0.15,1.02])。该模型在AD连续体的早期阶段的预测优于在临床的后期阶段(图3a)。该方法很容易推广到疑似非淀粉样蛋白病理(SNAP)和可能伴随的病理非阿尔茨海默氏症改变的纳入被试。

图3. 预测的绝对误差的变化取决于协变量。利用AD进程映射对ADAS-Cog13的预测结果。a由于预测设计(顶部4行,棕色)、被试的遗传和社会人口特征(第5-10行,蓝色)、被试的队列(第11和12行,粉红色)和缺失数据(第13至16行,灰色)造成的变化。B被试因A(肌样体)/T(au)/N(神经退行性变)/C(线形)状态引起的变化,分为:顶部为阿尔茨海默病连续体(顶部8行,绿色),之间可能为阿尔茨海默病和伴随的非阿尔茨海默病病理变化(第9行,橙色),底部为疑似非阿尔茨海默病病理生理学(SNAP)(底部3行,灰色)。系数低于零表明平均绝对误差(MAE)(更好的预测)低于参考被试和设计。例如,如果参考被试来自J-ADNI而不是ADNI,ADAS-Cog13的预测更准确,导致MAE下降0.63点(95% CI = [0.32,0.96])。箱形图表示中位数,第一和第三个四分位数;须表示经验的95%置信区间。

对MMSE和CDR-SB的预测也得出了类似的结论。AD进程映射在除一个外部验证队列外的所有外部验证队列上都表现更好。错误对用于进行预测的可用信息的变化是稳健的,如非盲访问的次数和缺失的数据。这种方法并没有对女性产生有偏见的预测。然而,对于年龄高于平均水平或受教育水平低于平均水平的被试和APOE-ε4携带者,对这两个端点的预测结果略差。

3.4 疾病进展模型选择了试验中显示疾病进展的被试

我们现在使用疾病进展模型来确定在试验中可能经历显著认知能力下降的被试(见图4)。显示进展的被试的定义取决于用于测量条件的端点和试验的持续时间。我们模拟了6个具有不同主要结果、试验持续时间和纳入标准的临床试验。这些设计的灵感来自于真实的III期临床试验(见表3)。

图4. 在临床试验中的预后富集程序的说明。参与者首先采用标准的纳入标准进行选择,并进行一系列的考试。一个疾病进展模型,如AD进程映射,然后预测每个被试的数据的进展,并预测被试是否可能在试验过程中取得显著进展,通过预测的结果变化来衡量,这是本例中的小型精神状态检查(MMSE)。治疗效果(例如,在试验期间MMSE变化减少25%)与预测慢进展组或合并两组相比,预测快进展组导致更大的效应量,因此样本量更小。因此,人们可以通过只监测预测的快速进展者组来证明使用较少的被试的治疗效果。

表3. 模拟试验的描述

对于每项试验,我们在验证集中选择了其中一次访问符合纳入标准的被试(作为模拟试验的基线访问),并在与试验理论持续时间相等的时间后参加随访。我们根据所考虑的结果(例如,端点相对于基线的年变化)是否高于或低于人群中值,将该人群分为两个相等的一半:快进展者和慢进展者。我们的目的是完全根据他们的基线数据来确定这两组的被试。

我们使用疾病进展模型从每个被试的基线数据中预测试验结束时的端点值。将预测结果作为预后评分。对于AD进程映射,皮尔逊与真实结果的皮尔逊相关性根据试验结果的变化范围为28%-47%,而对于RNN-AD,皮尔逊相关性范围为13%-36%。预后评分高于给定阈值的被试被认为很可能是快速进展者。我们绘制了6个模拟试验的受试者工作特征(ROC)曲线(图5)。6个模拟试验的ROC曲线下面积(AUC)在AD进程映射的65-80%范围内,RNN-AD的ROC曲线下面积在55-80%范围内(见图5)。

我们将这种预后富集策略与两种替代方法进行了比较:按照目前在大多数试验中所做的那样,随机选择被试(ROC曲线的平分线),或根据他们的APOE基因型选择参与者(图5中的灰色杂交)。所有的选择方法都明显优于随机选择,这意味着疾病进展模型成功地识别了进展者,而目前的实践确实在符合纳入标准的参与者之间有任何差异。除1例外,所有病例的AD进程映射谱选择均显著优于基于APOE基因型的选择。RNN-AD也优于这两种替代方案。然而,在6个测试场景中,它的表现明显低于AD课程地图,ROC的AUC分别下降了9%和14%。因此,当试验设计不同时,AD进程映射显示了比RNN-AD更稳健的结果。

我们分析了我们对进展风险的评估是否导致了某些类型的被试相对于真实进展者的被试的过度或不足选择。根据设计的不同,使用AD进程映射选择的那一组在男性或女性中表现出轻微的富集,并倾向于偏向于较年长的被试。被选中的被试通常,但不总是富集APOE- ε4变异携带者。所提出的疾病进展模型没有使用社会人口统计学或遗传因素作为选择显示进展的参与者的代理。因此,他们限制了性别、年龄或APOE-ε4携带者的偏见,这是当前实践的基础,以增加被试在试验中进展的可能性。

图5. AD进程映射和RNN-AD选择在试验中经历结果恶化风险的被试。接收机工作特性(ROC)曲线显示。他们展示了AD课程图和RNN-AD在选择随访期间主要结果变化最大的被试组方面的表现。阴影区域对应于经验的95%置信区间。每条曲线上的绿色圆圈和橙色三角形对应于将参与者分成两组的选择,条形图代表95%的置信区间。灰色选择APOE-ε4携带者(1或2个拷贝)时的特异性和敏感性,条形图表示95%置信区间(注:第一次试验只包括APOE-ε4携带者,因此没有灰色交叉)。统计数据是计算验证集的n = 100重采样的(见方法)。源数据作为源数据文件提供。AUC:ROC曲线下面积(平均±标准差,置信区间为95%)。

3.5 疾病进展模型可用于设计更有力的临床试验

自动选择显示进展的被试使得在试验中实施预后富集策略成为可能(见图4)。对于每个试验设计,我们模拟了一个降低结果值的假设治疗方法。我们计算了显示一系列治疗效果的治疗效果所需的样本量(见方法)。我们将所有符合条件的被试被纳入时的结果与仅被纳入基线时预测为快速进展者的被试时获得的结果进行了比较。

我们根据所有6个模拟试验的处理效果绘制了样本量(图6)。在所有测试的场景中,根据AD进程映射,选择有进展风险的被试,允许样本量显著减少。对于25%的处理效果,被试发病的风险的样本量减少了50.2%(±7.1),试验针对临床前广告和高脑淀粉样蛋白水平减少了40.9%(±4.9),35.4%和38.1%(±45.4%(±2.0),早期AD和高水平的大脑tau蛋白减少了44.6%(±3.9),轻度认知障碍减少了43.1%(±0.8)。

对于所有临床前和早期AD试验,基于AD进程映射的富集明显优于仅对APOE-ε4变异携带者的选择。对于由AD引起的轻度认知障碍或轻度AD试验,基于AD进程映射的富集表现与针对APOE-ε4携带者没有显著差异。AD进程映射在样本量上也实现了类似的减少,但不需要针对特定的基因图谱。在这种情况下,我们也发现了49.2%(95% CI = [48.6,49.9])的被试将被AD进程映射选择,而杂合子APOE-ε4携带者为39.1%(95% CI = [38.7,39.4])。与目前的实践相比,RNN-AD还允许显著减少样本量,根据测试的场景,从21%减少到42%。然而,在RNN-AD产生较低的AUC的两种情况下,AD进程映射分别增加了10%和35%的被试。

图6. 基于AD进程映射的富集显著减少了假设的治疗效果的样本量,范围为20%到30%。报告的样本量是两组患者的总样本量。浅阴影区域代表95%置信区间,暗阴影区域代表中值周围的50%置信区间。在所有临床前和早期阿尔茨海默病(AD)试验中,基于AD进程映射的富集显著优于基于APOE- ε4携带者的富集。

4. 讨论

我们使用疾病进展模型来预测AD连续体的所有阶段的认知能力下降。使用包含超过4600名被试的5个独立队列,我们在这里展示了AD进程映射提供了一个公平、稳健和可推广的预测方法。这是公平的,因为它的预测对性别没有偏见,而且只受到受教育水平和被试的年龄的轻微影响。该方法对于缺失的脑脊液或Tau PET生物标志物是稳健的,但一般来说,当有MRI和淀粉样PET数据时,可以获得更好的结果。该模型是根据在北美获得的数据进行训练的,但它很容易推广到来自欧洲、亚洲和大洋洲的被试,而且没有造成性能损失。它在AD连续体的早期临床前阶段表现得比在疾病的后期阶段表现得更好,因此与早期干预相关。

在一项试验中,疾病进展模型自动识别已经有认知能力下降风险的被试。因此,它们可以用来丰富在试验期间可能经历给定端点恶化的参与者的试验人群。通过针对显示进展的更同质的被试群体,AD进程映射使其有可能显著减少样本量,减少了38%至50%,代价是丢弃大约一半的筛查被试。它比深度学习方法RNN-AD具有更好的鲁棒性。疾病进展模型可以无缝地适应各种针对不同疾病阶段、不同结果和试验持续时间的不同临床试验设计。他们这样做,而不需要为每个新的试验重新训练模型。相比之下,最近一种基于另一种预后评分的方法报告的样本量减少了20%至28%。

该方法的主要局限性是用于监测疾病进展的数据。认知评估显示出约10%的评分者间变异性。同一被试的MRI生物标记物在同一天获得的两次扫描之间也显示出相似程度的可变性,其可靠性因处理管道中可能发生的变化而进一步降低。从不同的免疫分析中定位脑脊液生物标记物也限制了其可靠性。这些因素限制了预测疾病进展的方法的准确性。增加这些测量值的可靠性将提高这里描述的方法的性能。在未来,疾病进展模型,如AD进程映射也可能受益于包含有前途的新的生物标志物,如血浆生物标志物、神经丝轻链或数字生物标志物。

鉴于这些限制,值得注意的是,利用常规数据可以实现如此大的样本量减少临床实践这些发现证明了配套软件工具在试验中招募患者和在未来支持临床医生的好处,使他们能够在正确的时间为正确的患者开出正确的治疗方法。

5. 方法

5.1 被试

我们使用了来自5个纵向多中心队列的数据:ADNI(N=1652)、澳大利亚成像、生物标志物和生活方式旗舰研究(AIBL)(N=460)、JJ-ADNI(N=470)、PharmaCog队列(N=111)和MEMENTO队列(N=1994)。

研究方案的伦理委员会批准的南加州大学(ADNI),奥斯汀健康,圣文森特的健康,私立医院和伊迪丝考恩大学(AIBL),IRCCS研究所中心圣乔瓦尼迪迪奥基金会(PharmaCog),委员会保护委员会等三世((MEMENTO)、国家生物科学数据库中心人类数据库(J-ADNI)。知情同意书是根据《赫尔辛基宣言》和相关准则和条例进行的。

这5个队列是纵向观察研究,PHARMACOG平均观察期为2.0年到ADNI平均观察期为4.8年,平均访问次数从AIBL的3.7到MEMENTO的6.9不等。我们考虑了所有至少有一年随访的被试。表1和表2报告了所选被试的社会人口统计学、遗传学、生物学和临床特征,以及每个队列中可用数据的比例。

5.2 神经心理评估

在我们的实验中,我们考虑了以下神经心理评估:迷你精神状态检查(MMSE),阿尔茨海默病评估量表-认知子量表,共13项(ADAS-Cog13),临床痴呆评分量表-盒子评分之和(CDR-SB)。

5.3 结构性磁共振成像/解剖成像生物标志物

我们从三维T1加权磁化准备的快速梯度回波成像(MPRAGE)序列中提取了皮质和皮质下的体积。对于ADNI研究,扫描采用了形态测量分析的标准化方案。ADNI、AIBL、J-ADNI52、PharmaCog36和MEMENTO使用了相同的MRI方案,皮质重建和体积分割都使用Freesurfer进行。

5.4 脑脊液生物标志物

我们使用了脑脊液中β-淀粉样蛋白1-42肽(Aβ1-42)、苏氨酸181残基磷酸化的Tau蛋白(p-Tau181)和总Tau蛋白(t-Tau)的浓度。ADNI使用自动电生免疫分析法(Roche);AIBL、PharmaCog,和 MEMENTO使用INNOTEST单分析ELISA检测(Innogenetics/Fujirebio NV),J-ADNI使用多重xMAP Luminex平台和INNO-BIA AlzBio3 immunoassay kit(Innogenetics/Fujirebio NV)。在每个队列中,我们使用具有随机截距的线性混合模型,将每个生物标志物与年龄、APOE基因型和CDR全局评分进行回归。然后,我们对测量值进行线性变换,使所有队列的截距为0,总方差为1。

5.5 正电子发射断层扫描/功能成像生物标志物

对于ADNI被试,我们使用了从淀粉样PET扫描([18F]- Florbetapir和[18F]- Florbetaben放射性示踪剂)中提取的区域标准化吸收值比(SUVR),以及从ADNI 3开始,Tau PET扫描([18F]-AV-1451放射性示踪剂)。每次PET扫描都与被试的MRI一起登记,在时间上尽可能接近PET扫描。对于淀粉样PET,我们使用了由额叶、前/后扣带、外侧顶叶和外侧颞叶区域组成的皮质总结区;数据用由整个小脑、脑干/脑桥和侵蚀的皮质下白质组成的复合区进行归一化。这些PET SUVR值使用文献中列出的方程转换为厘米尺度(CL)。在AIBL队列中,与已发表的厘米样蛋白转换方程相对应的处理过淀粉样蛋白PET SUVR数据没有公开获得。在MEMENTO队列中,淀粉样PET SUVR数据不能与ADNI数据直接比较,也没有厘米样转换方程。因此,我们仅使用这些队列中的淀粉样蛋白PET数据来定义参与者的淀粉样蛋白状态,使用这些研究提供的病理阈值。对于Tau PET,我们对所有感兴趣的Braak解剖区域(I-VI)使用体积加权平均SUVR值,对小脑下灰质进行归一化。

5.6 A/T/NC分类

我们根据临床痴呆评分(CDR)整体评分将A(myloid)/T(au)/N(神经变性)分类,以及C(认知)/C(临床)组。在特定访问中的被试类别是基于患者迄今为止有史以来最差的生物标志物水平。

5.7 疾病进程模型

我们训练并测试了两种疾病进程模型:AD进程映射和RNN-AD。AD进程映射是建立在一个参数贝叶斯非线性混合效应模型的原则之上的。RNN-AD是建立在循环人工神经网络的原理之上的。这两个模型的实现都依赖于由它们各自的作者公开提供的开源软件。

两种模型都使用相同的端点作为输入:MMSE、CDRSB、ADAS-Cog13、左右海马和侧脑室的体积、脑脊液Aβ1-42和p-tau181水平,以及淀粉样PET和Tau PET扫描的皮质总结SUVR。它们在一个被试的一次或几次访问中考虑这些端点,考虑到可能缺失的数据,并预测未来任何时间点的所有这些端点的价值。AD进程映射也考虑了被试在每次访问时的年龄,而RNN-AD只考虑了连续两次访问之间的持续时间,而不考虑被试的年龄。此外,RNN-AD需要在相应的就诊时对被试进行诊断,诊断为认知正常、轻度认知障碍或疯狂,如ADNI方案所定义。

AD进程映射假设这些端点在疾病进展过程中遵循一个逻辑进展曲线,在拐点处有不同的进展率和年龄。它通过改变进展和疾病表现的动态(即端点之间进展的顺序和时间),学习如何调整这组逻辑曲线以适应个体数据。逻辑曲线参考集的形状和位置是固定效应,而改变这些曲线以拟合单个数据的参数是随机效应。模型参数(固定效应以及随机效应的平均值和方差)是使用包含多个被试重复测量的训练数据集来估计的。在训练阶段结束后,该模型拟合于一个测试被试(在训练测试之外)在一次或几次访问中的测量值,使用学习到的随机效应的分布作为正则化器。因此,该模型预测了一组特定于主题的逻辑曲线,它显示了被试在任何年龄的每个端点的值。

相比之下,RNN-AD对端点的终身进展模式没有任何假设。相反,它学习了在给定时间点的端点的值将如何变化。1个月的过渡是假设是端点的当前值和当前诊断(如人工神经元)的非线性函数。这个转换函数的参数是使用一个包含大量参与者的重复测量的训练数据集来估计的。在训练阶段结束后,一个测试被试(在训练集之外)在一次或几次访问中的测量值被用作模型的输入。然后,该模型将计算未来每个月的所有端点的值。AD进程映射可以用缺失的数据进行训练和测试:可能性仅使用可用的数据进行优化。模型训练对缺失的数据具有鲁棒性,所以我们没有进行数据推断。相比之下,RNN-AD在基线访问时需要完整的数据。

这两个模型还需要一个数据规范化的内部步骤。对于AD进程映射,根据每个评估的理论最小值和最大值,认知评估被归一化为0到+1的量表,0表示理论最佳值(未受影响的被试),+1表示可能的最差值。协调的淀粉样蛋白PET数据在0到100之间被裁剪,并转换为(0,1)尺度。MRI、tau PET和协调的脑脊液数据在第一个和最后一个百分位数处被裁剪,然后线性映射到(0,1)尺度。对于RNN-AD,归一化包括一个由训练数据估计的z分数变换。无论采用归一化程序,在分析之前,模型的输出总是转换回测量的原始尺度(和单位)(见图1)。因此,预测值与真实的、非标准化的数据具有可比性。预测错误可以在不使用相同的标准化过程的方法之间进行比较。

5.8 验证分析

我们将数据集分成两部分。我们首先考虑根据脑脊液或PET数据淀粉样蛋白阳性的ADNI被试。然后,我们保留其他ADNI被试和其他四个队列的所有被试作为外部验证集。然后,我们将淀粉样蛋白阳性的ADNI被试分成5个随机折叠,并使用5个折叠中的4个被试的所有可用数据来训练AD进程映射和RNN-AD,例如,训练集。我们用另一个分裂重复了这个过程,因此我们得到每个模型有10个实例。在遗漏的部分中,每个参与者都被计算了两次作为测试对象。因此,它可以用于评估每个模型的两个不同实例的预测任务。相比之下,外部验证集中的每个被试都可以用每个模型的10个不同实例进行测试。下面,我们对测试集中被试的两个模型实例的预测取平均值,对外部验证集中被试的10个实例的预测取平均值。无论是AD进程映射还是RNN-AD,测试对象都没有对任何模型选择或超参数调整做出贡献。因此,我们将测试对象的预测与外部验证集中的预测集中起来。

5.9 预测端点

我们的目的是评估每个模型的准确性,以预测在测试集或外部验证集中的一个被试的端点值。一般的原则是对被试的最新数据进行盲测,将非盲测数据作为模型的输入,并将预测值与盲测数据进行比较。我们使用了一个组合过程来生成预测任务。我们要求被试在50到90岁之间,CDR全球最多在最新的无盲访问排除严重疯狂的被试,而盲访问用来评估预测下降1.4和6.6年后最新的无盲访问。我们将预测误差计算为该值与相关随访时的端点值之间的绝对差值。

5.10 预测误差分析

我们用混合效应模型分析了平均绝对误差的分布。我们纠正了几个可能的共同创始因素的错误,并解释了多个预测来自同一被试的事实。在实践中,对于一个给定的端点和一个给定的模型,我们执行了100次以下步骤:我们随机选择了一个脱节的预测任务子集,即预测不共享任何共同访问(无论是预测的盲访问,也不是用于预测的非盲访问);我们对每个个体使用以下分类解释变量的多元线性混合效应模型:A/T/N/C阶段预测,队列,APOE-ε4等位基因的数量,性别,教育水平,和连续解释变量:实际患者的年龄预测为75岁,标准化为7.5年,预测以三年为中心,标准化为一年,非盲访问为8个月和3个月的平均时间,每个模式的非盲访问缺失数据百分比。根据联合国教育国际标准分类的准则,如果正规教育不超过9年,教育水平为低;如果至少16年的教育,则为高。我们推导了模型截距(根据共同因素调整的平均绝对误差)和回归系数(平均绝对误差与每个共同因素之间的关联)的平均和经验置信区间。

5.11 与其他方法的比较

我们还比较了AD进程映射与另外两种替代方法。第一种是无变化预测或最后一次观察结转方法,预测一个端点值与最后一次非盲访问时相同。第二种方法是线性混合模型方法,包括为每个端点生成一个线性混合影响模型,将端点值与连续访问时被试的年龄进行回归,每个被试使用随机截距和随机斜率。该模型被拟合到一个看不见的被试与一个最大的后验估计量。我们对所有模型都使用了相同的验证程序:AD进程映射、RNN-AD和线性混合模型。

5.12 临床试验模拟、富集评估和样本量计算

我们模拟了有AD风险或AD早期阶段的被试的临床试验,如表3所示。对于每个试验,我们选择所有对访问从所有被试的五个数据集满足以下标准:试验的主要端点评估在两个访问,病人满足纳入标准,没有排除标准的试验在基线访问,访问按试验时间间隔,根据试验的不同,有一定的耐受性。对于每一对随访,第一次被认为是纳入时的基线随访,第二次被认为是试验结束时的随访。我们没有考虑到可能的中间访问。

我们首先从诊断测试的角度评估了我们的预后富集策略。对于每一项试验,我们使用上述程序,仅从基线数据中预测随访时的主要端点的值。我们计算了结果的中位数(即基线和随访之间的年变化率)。超过这个阈值的被试被认为是快速进展者,并形成了要确定的目标人群。使用预测结果的阈值将人群分为两组:一组认为进展风险高,另一组认为进展风险低。我们让低风险和高风险的阈值发生变化,并计算得到的被试操作特征(ROC)曲线。在这条曲线上,我们确定了将人群分为低风险人群和高风险人群的点,作为操作点。我们通过对随机选择100次一半的样本进行的分析来确定置信区间。在任何给定的运行中,任何病人的访问使用不超过一次。ROC曲线周围的置信区域被可视化地构造为沿着阈值的敏感性和特异性置信区间的包络线。我们评估了在进展高危组中可能存在的偏差。我们使用逻辑回归预测人群协变量(年龄、性别、教育程度、APOE-ε4等位基因数量)、队列和缺失的基线模式的选择状态,以及快速进展的真实指标。这最后一个二元预测器被包括用来检查除了在目标人群中自然存在的偏差之外出现的偏差。

然后,我们通过计算统计能力来评估我们的预后富集策略。我们使用了一个假设的个体治疗模型:如果被试在基线和随访之间的结果实际上恶化了,我们就根据治疗效果改变了年变化率,例如,年变化率提高了20%。如果被试在基线和随访之间有所改善,我们就没有应用治疗效果。对于从20%到30%的治疗效果,我们从两个独立的样本渐近t检验中计算了效应量(Cohen’s d)和样本量,具有5%的双侧显著性水平和80%的统计能力。我们将所选择的人群的样本量与单独的试验纳入标准以及被确定为进程高风险的亚群进行了比较。

在这两个实验中,我们将获得的结果与选择APOE-ε4载体(杂合或纯合)作为进程高风险被试的结果进行了比较。我们无法将这种方法用于针对有AD发病风险的被试的试验,因为该试验只包括APOE-ε4携带者。

5.13 统计和重复性

我们没有使用统计学的方法来预先确定样本量。我们考虑了来自所有队列的所有可用数据,并只排除了随访时间少于一年的被试的数据。由于只使用了观察性数据,所以这些实验不是随机的。研究人员在实验和结果评估中没有盲目的分配,因为只使用了观察数据。临床试验的模拟包括随机非盲分配到治疗组和对照组,并评估性别、中心、教育水平和APOE基因型的偏差。

参考文献:Forecasting individual progression trajectories in Alzheimer’s disease

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 摘要
    • 3. 结果
      • 3.1 研究人群的特征
        • 3.2 疾病进展模型学习在疾病进展过程中生物标志物水平变化的时间
          • 3.3 疾病进展模型预测了认知能力的下降
            • 3.4 疾病进展模型选择了试验中显示疾病进展的被试
              • 3.5 疾病进展模型可用于设计更有力的临床试验
                • 5.1 被试
                  • 5.2 神经心理评估
                    • 5.3 结构性磁共振成像/解剖成像生物标志物
                      • 5.4 脑脊液生物标志物
                        • 5.5 正电子发射断层扫描/功能成像生物标志物
                          • 5.6 A/T/NC分类
                            • 5.7 疾病进程模型
                              • 5.8 验证分析
                                • 5.9 预测端点
                                  • 5.10 预测误差分析
                                    • 5.11 与其他方法的比较
                                      • 5.12 临床试验模拟、富集评估和样本量计算
                                        • 5.13 统计和重复性
                                        领券
                                        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档