在世界级评测大赛上经常能看到一支队伍,他们低调,却是各项赛事冠军的常客。这支队伍有一个统一的名称——平安智慧医疗。
从2019年春天到夏天,平安智慧医疗创造了多项世界第一战绩:
在国际权威的医疗影像领域学术会议ISBI(The IEEE International Symposium on Biomedical Imaging)举办的肺癌病理分割(ACDC)、内窥镜影像质控(EAD)和病理性近视检测(PALM)三个竞赛中,他们斩获三个总冠军和六个单项世界第一;
《华尔街日报》报道平安在ISBI获得三个项目总冠军
在全球顶尖的AMIA峰会上,发表《基于ICD层级结构的中文电子病历智能编码》和《集成多源数据和机器学习模型的中国传染病预测》两篇论文;
在美国肾脏病学会的顶级期刊《美国肾脏病杂志》上,发表《lgA肾病的肾脏终点预测和风险分层》;
在国际计算语言学协会(ACL)举办的智能医疗问答大赛MEDIQA 2019中,夺得了1项世界第一(医疗问题蕴含RQE)、2项世界第二(医疗文本语义推断NLI、医疗问答排序QA);
在医学信息学领域顶级国际会议ICHI(International Conference of Healthcare Informatics) 2019上,以绝对优势夺得医疗缺失数据修复大赛Data Analytics Challenge on Missing data Imputation (DACMI)世界第一;
在国际顶级自然语言处理会议EMNLP举办的COIN 2019文本理解大赛上,包揽本次大赛总成绩世界冠军以及选择题文本理解(准确度90.6%)和完形填空文本理解(准确度83.7%)两个子任务的全部单项冠军。
平均行业经验超过10年
资料显示,中国有3亿以上慢性病以及潜在慢性病患者,平安智慧医疗要解决的问题远远不止涉及3亿人群。在他们“理想国”中,他们要建起一座可移动的堡垒,动则能辅助医生消灭“所有的致病病菌”,静则能辅助医生抵御“潜在病菌”的入侵。健康是这支部队唯一保卫的对象,而各种疾病则是他们一致的“敌人”。
这是一支由谢国彤博士(现任平安集团首席医疗科学家)带领的队伍,一批资深算法及人工智能专家博士是其中的主要成员,平均行业经验超过10年。
“知识+数据”双轮驱动
谢国彤制定的战术是从诊前、诊中、诊后,整个就诊过程着手,建造一道可攻可守的AI城墙。平安智慧医疗智能辅助诊疗负责人胡岗博士和平安智慧医疗资深人工智能专家孙行智博士带领的是这支部队中负责打造涉及诊前、诊中、诊后AI模型的队伍。
诊前,运用AI机器人引导患者到正确的科室就诊;诊中,AI模型既要辅助医生降低误诊、漏诊率,又要辅助医生评估出需要转诊治疗的危重患者,在确诊之后,AI模型继续推荐给医生用药和治疗方式指导;诊后,通过随访机器人与患者交互,辅助医生完成定期随访,而医生则可以将更多的资源节约出来,留给需要重点关注的危重人群。
胡岗和孙行智都是算法领域的顶尖高手,但当算法遇到医疗,似乎就陷入了流沙。“我们在数据上不停地训练、调优,模型在数据的测试集上有很好的表现,但推广出去发现效果并不理想。”
“医学是一个知识密集型学科,会涉及到很多常识和知识,而人工智能往往又是根据数据训练模型。单从数据出发得到的模型,推荐出的结果甚至会违背医学常识。”
算法之外,另一样核心武器——知识
“医学知识其实是一个框架,包含了临床指南、专家共识等权威但比较宽泛的信息。而医疗数据,覆盖了大量具体的诊疗案例,不仅可以对知识起到补充和提高精细化的作用,数据还能挖掘出其中更多的隐含关系。”
传统的模型训练都从数据出发,而胡岗和孙行智摸索出的是一条利用知识来指导数据建模的方式,由知识对数据,特征,优化目标函数,和模型融合做一些修正,使得最终模型和医学知识有较高的一致性,更重要的是,可以根据患者的具体情况提供更加精准的推荐。
通俗来讲,知识和数据模型融合的过程,大概有点类似揉面团:胡岗负责搭建知识库,也就是造面粉;孙行智负责加水,数据浇灌面团。知识和数据不断地被添加进来,面粉加多了加水,水加多了加面粉。知识和数据在这个过程中,不断相互融合和补充, 最后“揉出”一个优质的模型。
“但这还不够。”
平安智慧医疗辅助决策系统在“人机大赛”中取得胜利
第二步是解决“Why”的问题,输出的结果为啥非得是张三,不是李四?
有了知识这个工具,根据结果,模型可以提供知识上的证据,比如专家共识和国家指南对这类疾病的规范化治疗方式;同时,模型也可以提供数据上的证据,比如相似的病例,不同的治疗方法下,哪一种方法更佳。这些证据共同推荐给医生,由医生做出“最正确”的抉择。
但这,还是不够。
模型训练完了,怎么验证可应用性?这才是最磨人的较劲。首先,先和过去比。比如在与新加坡医疗机构的合作中,“我们要拿他们六年的数据做回顾性的验证。”看看现在的模型在以前的数据上表现如何。然后,再和未来比。
“我们把模型放到医院去做试点,再找一些没有使用模型的对照组,做前瞻性验证。观察一段时间,看看两个组的诊疗效果是否有差异。”
基于这些略显冗长的脚步,一年多后,胡岗和孙行智终于到达树荫下。回看过去,他们双脚走过的不是赛博世界冰冷的数据,而是一群人带着体温的战火激情。
诊断上,现已覆盖1500种疾病,常见60种疾病诊断精度达95%。
治疗上,支持2000种疾病治疗方案以及常见60种疾病个性化治疗推荐。
仅甘肃一省,已覆盖1000家基层医院为主的系统应用。
|