对AI产业来说,数码医疗可以快速发展,尤其是医疗影像的数码学习以及医疗影像的分享,计算机断层、核磁共振、腹部超音波的影像跨院信息分享等。
以心脏超音波(echocardiography)为例,一个典型的研究需要70笔左右从各个视角(viewpoint)拍摄的影片,而且这些影片的拍摄视角往往没有注记(label)。要做心脏超音波的机器学习,大概会做下列几件事:1.建立自动化计算机视觉流线(automated computer vision pipeline)以自动下载超音波影片及其元数据(metadata)。2.以卷积神经网络(CNN)机器学习辨识视角。3.以卷积神经网络在图像中识别物件(image segmentation),譬如左心房。4.心房、心室结构和功能之量化。5.以喷出比(ejection fraction)和全域纵向应变(global longitudinal strain)-上一步骤所获得的量化数据-判断心脏功能。6.建立心脏疾病模型,壁如心肌肥厚或淀粉样变性(amyloidosis,一种类似阿滋海默氏症因蛋白质错误摺叠所形成的心脏疾病)等。
我讲的这个例子不是过去既有的知识,而是刚在arXiv上1月公开的文章(https://arxiv.org/abs/1706.07342),正在送到期刊审核、发表,这是学术研究的前沿,但是也有立即转化成应用的潜力。
目前医疗、AI界也有类似的合作计划,进展也相若。但是资料流通架构,以及从其中累积的大数据在AI领域这已经成了常识:数据的多寡比算法的优异与否更重要,而且通常领先者全拿,像Google的查找引擎。以上述研究为例,使用的资料仅是从3个个别资料库取出的4000笔心脏超音波影片。
针对医疗行为本身的使用,这个架构如果要能够提供数码医疗机器学习使用还需要至少几方面的基础建设:
1. 高性能计算能力(HPC:High Performance Computing)。人工智能所需的GPU及类似芯片,有一部已可稳定运行,另外还要涵盖资安、带宽等考量,这是人工智能主要计划之一。
2. 一个类似Google File System或Colossus的系统。现在各医疗院所分散式的储存医疗资料需要能够让AI计算机从远程自动、流线式的读取经核可的选定档案。
3. 医疗资料的规格及医师的注记。以前述的心脏超音波为例,虽然都是用医疗数码影像传输协定(DICOM;Digital Imaging and Communications in Medicine)在医学影像存档与通信系统(PACS;Picture Archiving and Communication System)下运行,但是离机器学习的方便、有效使用还有相当距离。
AI医疗的开展进一步会回馈到整个医疗体系,以前述的心脏超音波研究为例,提供远距、快速、高质量、低费用的医疗诊断以及疾病预防!
关注DIGITIMES,产业资讯一手掌握
领取专属 10元无门槛券
私享最新 技术干货