前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于“机器学习”,医生们需要知道的5件事

关于“机器学习”,医生们需要知道的5件事

作者头像
企鹅号小编
发布2018-02-24 17:06:17
9110
发布2018-02-24 17:06:17
举报
文章被收录于专栏:人工智能

作者:麦子

转载请注明:解螺旋·临床医生科研成长平台

机器学习,简单可以理解为一种数据分析的方法。医生们对数据驱动型预测研究应该不陌生,比如利用风险评分来指导抗凝治疗(CHADS2)和降胆固醇用药(ASCVD),还有ICU患者的风险分层(APACHE),都是在大型数据统计分析的基础上建立的。

但机器学习是很不一样的分析方法。它不仅是某些高大上的科学家的研究工具,也不是“将来我们学会了也可以用”。它可能会改变我们的日常医疗活动,不仅是让我们利用这些研究成果,我们也很可能不知不觉中已经为其研究贡献了数据量。

近一两个月内,一些大期刊比如Science、NEJM等,又频频发出关于人工智能和机器学习的研究和社论,有的报告新成果,有的谈未来谈希望,也有的提出“期望值不要太高”的警示。Medscape也整理了一些关于机器学习在医学研究与应用中,人们普遍关心的五个问题,对这门新技术给予冷静的关注。

1

机器学习到底是啥?它跟传统的统计预测模型以及计算机算法有什么不同?

机器学习是人工智能领域近年来取得的突破性进展,它是指利用算法来检测数据中的模式,而不需要明确的指示。一个学习系统可以利用训练数据集,学会找出输入信息(例如图片)的特征与输出信息(如标签)之间的关联。

也正是不需要明确指示这一点,造就了它和传统数据分析的本质区别。它吞下一个数据集,经过一段消化(解析、运算),输出一个结论,而它的消化过程扒出来给人类看,以目前的水平我们还是看不懂的,俗称“黑箱”。由此甚至孵育出一门叫“AI神经科学”的学科,试图理解AI的“思维”。

在NEJM的一篇评论中,哈佛大学医学院的Zaid Obermeyer和Ezekiel Emanuel做了个比喻,机器学习就像住院医师,试图通过病人呈现的临床表现来理解其健康状况,而传统的算法则像一位医学生,将普适性的规则应用于新接触到的病人。

我们也可以想想自己看病的过程,从问诊开始,接着视触叩听、辅助检查,你收集了多少信息?然后又怎样筛选出核心信息,并将它们整合,最终得到一个诊断结论?你恐怕不会计算某症状占多少权重、某检查结果又占多少权重,再计算出患某病的概率是多少。

但这却是传统回归模型的思维方式。做队列研究,收集几个变量的数据,然后用统计学回归模型来拟合。来了新病人,再把他的情况丢到这个模型中,看看他处在哪个风险区域。这类研究中收集的那几个变量哪能跟临床诊断时收集的相比,它们是经过严格筛选的,尽量消除偏倚,而现实中的数据则没这么结构化。

机器学习与回归模型相比的特点,也正是可以处理许多的自变量(predictors,也称预测因子),甚至多过观察的样本量,再以非线性的方式进行整合。它更适用于分析现有的、真实生产活动中数据,但就目前的技术水平来看,预测短期事件还行,长期精确度就会有所下降。

2

目前机器学习在医学中有哪些成功?

机器学习在医学中已有不少的运用,如癫痫、痴呆、心梗后生存率等方面的研究。其最成功的地方在于诊断与预后判断的潜力。

就目前已有的研究中,识别图形(如病理图片、放射影像学图片,甚至病灶局部的手机拍摄照片等)类的研究最多,也较为成熟。这跟已普遍运用于机场安检,以及某些小创业公司都能用于上班打卡的人脸识别技术很像。由此看来,机器学习很有潜力在放射学、解剖病理学、皮肤病学和肿瘤学的诊断中掀起一场波澜。

尽管有这些令人可喜的成果,它也还是处在研发的早期,面临许多障碍。在NEJM的另一则评论中,斯坦福大学的Jonathan Chen和Steven Asch提醒研究者,我们的期待是有些“膨胀”了,需要理性地重新调整我们的期望。

3

目前机器学习用于医学的障碍有哪些?

数据是机器学习的“食物”。机器学习系统要吞下足够的数据,直到它发现数据中的模式,或说规律,才能输出有意义的结果。它的食物来源有可能是专门设计课题,招募大量受试者,生成新的数据,也有可能是整合好几个已发表的研究数据,还可能利用日常真实的医疗活动中产生的数据。

说到这里,可能你每天写的病历都会成为它的食物。曾听说国内有企业在跟医院对接,获取电子病历数据进行分析,但暂时没有听到有成果汇报的消息。就算你的医院没有参与这些项目,保不齐这技术一火,你现在写的病历将来就会参与研究。

所以也许最大的障碍就是它所使用的数据是否恰当,以及它们的质量如何。如果在训练过程中使用了不完整、不恰当、有偏倚、不稳定的数据,甚至错误的数据,那么最好的结果可能是做出来的分析毫无意义,最糟的则可能导致误导性甚至有害的分析结果。

但什么样的数据才是“正确”的数据?多少才算足够?获取数据的成本多大?我们又该怎样检测、理解数据中可能存在的偏倚或错误?还有那些关键但又“不可量化”的信息(包括社会与文化因素等)怎么整合?

当然这里的许多问题,也广泛存在于常规医学研究中。机器学习中更为突出的问题则有:怎样验证你的发现?与“最优秀的”医生比较,还是另设计实验?如果它得出结果的机制我们无法理解,那我们怎样能将它的发现转化到临床实践中?甚至,我们怎么才能信任它?

还有伦理和法律上的问题没讨论清楚,即出错了谁负责?怎样制定有效的质控方案?

再者,能从自变量预测结果,却没能鉴定有实际意义的原因(有相关性不等于有因果关系),也就无法采取针对性的行动,怎么破?目前机器学习还没法回答,疾病是如何产生、为什么产生的。

这些是目前研究的边界。而Science上刚发了一篇报道,介绍各路科学家如何解开AI的黑箱,理解它的“思维”,以及怎样克服数据本身缺陷的问题,也许会给我们带来希望。

4

机器学习在医学中有什么潜力?

尽管还有诸多障碍,但医学及生命科学的许多学者都已在尝试运用它。它将数据转化成知识的潜力,已经开始重塑我们诊断及预后判断的精确度。

除了预测、检测异常,它们应该可以做更多的事情,执行更复杂的任务,它会成为一个有用的工具,而不是医生们的就业威胁。

有学者希望,将来它还可以在预测的基础上突破,找到疾病的根源,甚至在个体层面。但这需要足够多的数据去训练——指样本量足够大,且变量足够丰富。

但我想这在一定程度上也与我们对疾病本身的理解有关,会影响到我们用什么数据去“喂养”它。它也是吃什么长什么,没法凭空捏出不存在的信息。

例如用临床病历数据去喂养一个机器学习系统,让它预测患者再次住院的概率,但效力不高,那是因为再住院除了跟临床因素有关,也在很大程度上受经济因素影响,缺了这部分数据的输入,预测的准确性就会受限。从这个意义上说,机器学习的潜力和人类现有的知识、探索潜力息息相关。

不知机器学习系统会不会有朝一日进化出成熟的自己检测数据边界、自己捕获新数据的能力,把触角伸向我们没发现的东西。但那更需要时间。

5

机器学习会改变患者护理或医疗实践吗?

很有可能,但详情还有待探讨。如果机器可以提供更好的结局,我们为什么不用呢?

也许机器学习能将更多的技术活(或搬砖活)揽过来,而把医生解放出来干点别的。有人过于乐观地担心它会取代人类,也有人悲观地觉得技术没突破会导致投资减少变成一场空欢喜,但研究者们还是应该理性地期待。

患者们似乎是机器学习的最大获益者。在医疗活动中,医生的中心地位无可否认,不过如果机器学习能有更成熟的模型,能够成功地改善诊断、预后、查找病因和治疗方案的制定,我们肯定也会很欢迎这个新的医疗时代。

参考资料:

1. 5 FAQs About Machine Learning in Medicine

2. The AI revolution in science

3. Machine Learning and Prediction in Medicine — Beyond the Peak of Inflated Expectations

4.. How AI detectives are cracking open the black box of deep learning

5. Predicting the Future — Big Data, Machine Learning, and Clinical Medicine

本文来自企鹅号 - Freescience联盟媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - Freescience联盟媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
人脸识别
腾讯云神图·人脸识别(Face Recognition)基于腾讯优图强大的面部分析技术,提供包括人脸检测与分析、比对、搜索、验证、五官定位、活体检测等多种功能,为开发者和企业提供高性能高可用的人脸识别服务。 可应用于在线娱乐、在线身份认证等多种应用场景,充分满足各行业客户的人脸属性识别及用户身份确认等需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档