摘要
基于组织的癌症研究可以产生大量的载玻片形式的组织学数据。这些数据包含重要的诊断,预后和生物学信息,并可以使用扫描设备数字化成高分辨率的全景图像。在癌症研究中有效利用数字病理学数据需要对这些大量的图像数据进行管理,可视化,共享以及定量分析。这些任务对于商业数字病理学软件的研究者来说是复杂和困难的。在这篇2017年发表在Cancer Research上的文章中,描述了一个Digital SlideArchive (DSA),一个基于Web的开源软件数字病理学平台。它允许调查人员管理大量组织学图像,并将其与临床和基因组元数据整合。开放源码模型使DSA得以扩展,以提供额外的功能。
成像技术的进步已经导致了数字病理学数据的可用性的增加。图像扫描显微镜能够将整个组织切片数字化40倍。客观的放大,生成详细的图像,高分辨率捕获组织微环境和细胞学细节。这些图像可以揭示癌症现象的重要信息,如免疫反应和血管生成,可用于测量蛋白质的表达和定位,并对疾病进展的程度进行分级。
在2013年,这个团队就开发了Cancer Digital Slide Archive(CDSA)(http://cancer.digitalslidearchive.net),以提供与癌症基因组图谱(TCGA)的标本相关的图像。除了TCGA收集的广泛的基因组和临床数据外,冷冻和福尔马林固定的石蜡包埋诊断切片的数字病理图像来源于Tissue Source Sites提交的标本。开发CDSA的动机是将这些图像提供到更广泛的研究区域。CDSA提供了一个基于web的接口远程查看和搜索TCGA中数字病理学图像,避免了大型下载和软件安装的需要。
进而,这个团队又开发了Digital Slide Archive(DSA)(https://github.com/DigitalSlideArchive),这是一个基于CDSA的更通用的分布式平台 ,可以让调查人员共享、注释和分析他们的数字病理数据。我们采用了开源社区开发模式,以便用户可以定制和扩展DSA项目,以满足他们的具体研究需求。
DSA基于由Kitware开发和维护的称为Girder的数据管理工具包(https://data.kitware.com/)。Girder提供了跟踪图像和图像元数据所需的基础设施,将图像组织成集合,处理用户帐户和数据访问权限,以及启用数据提取和管理DSA安装。DSA允许用户在层次结构中管理他们的图像。元数据如病理学报告,临床数据,图像采集和组织处理信息可以连接到这个层次的任何级别。如下图所示:
一个图像是否有抗体和着色信息相关的属性,或PDF格式的病理学报告可以在样本水平得到。
数字病理学的关键能力是支持人类读者对图像区域的注释,以及这些注释的可视化,管理和共享。DSA可以让用户使用鼠标在图像查看器中生成注释,以创建多边形,矩形或椭圆。注释按层次排列,例如对应于不同的组织,对应于不同的读者的意见。为了兼容,DSA支持Aperio Imagescope的XML注释格式,Aperio Imagescope是一个免费的基于Windows的图像查看器,具有广泛的用户群。如下图所示:
除了DSA,这个团队还开发了一个图像分析算法的集合叫HistomicsTK(http://histomicstk.readthedocs.io/en/latest/)。HistomicsTK旨在提供常用图像分析任务(如颜色标准化,基本IHC评分,细胞和区域分类以及用于预测建模和基因组 - 组织整合的机器学习算法)所需的算法和流水线。除了常见算法和分析流水线的实现之外,HistomicsTK还提供了一个框架,使用户能够集成自己的算法,并在DSA中为这些算法自动生成用户界面菜单,以便与用户共享。
有关DSA的安装及使用,文章提供了一个小视频,可供学习(http://cancerres.aacrjournals.org/content/77/21/e75)。
参考文献:
Gutman, D.A., et al.,The Digital Slide Archive: A SoftwarePlatform for Management, Integration, and Analysis of Histology for CancerResearch.Cancer Res, 2017.77(21):p. e75-e78.
CEPI感谢您的支持!
(IOS系统用户专用通道)
领取专属 10元无门槛券
私享最新 技术干货