7月5日,医疗领域人工智能领军企业Airdoc创始人张大磊接受邀请,在上海复旦大学展开演讲(华山医院吴晞主任开展的选修课),滂沱大雨并没有阻挡学生对前沿科技的向往,众多计算机科学技术学院、数学科学学院、软件学院、基础医学院的学生前来听课,并且纷纷表示看好人工智能在医疗领域的应用。
在长达两个小时的课程中,张大磊先生向在座的学生讲述了人工智能的历史,人工智能在医疗领域的应用,医学领域人工智能的进展和需要突破的问题。
人工智能发展史
去年AlphaGo的横空出世,让越来越多的人开始直面人工智能,其实在AlphaGo出现前,人工智能已经有60年的历史,要追溯到1956年。
人工智能第一次高潮,20世纪40年代到50年代,许多研究者探索神经病学,信息理论及控制论之间的联系。其中还造出一些使用电子网络构造的初步智能,一直到1956年“人工智能”首次在达特茅斯会议中被提出,从而出现了第一次发展高潮
人工智能第一次低谷,在这个人工智能被提出后,AI届一致看好人工智能的发展,1956年,西蒙和纽厄尔预言“十年之内,数字计算机将成为国际象棋世界冠军。”然而10年过去,人工智能的发展远远滞后于当时的预测,这种乐观仅仅持续到1973年,《莱特希尔报告》的出现,报告用详实的数据说明,几乎所有的人工智能的研究都远未达到早前承诺的水平。而人工智能进入到了寒冬。
人工智能第二次高潮,第一次低潮后,人工智能逐渐被大部分人抛弃,接下来十年鲜有人问津,直到专家系统的出现,让人工智能再次回到了人们的视线当中,专家系统利用人工智能技术和计算机技术,在某个领域根据专家的经验进行推理和判断,从而让人工智能达到了新一次的高潮。
人工智能第二次低谷,专家系统的出现,让很多人看到了商业化的可能,我们稍微对人工智能了解一下,就可以知道人工智能对算法和硬件的要求十分之高,这对商业化是一个巨大的挑战,最终1987 年基于通用计算的 Lisp 机器在商业上的失败再次导致了人工智能进入低谷。
人工智能第三次高潮,这是离目前最近的一次高潮,而我们目前仍处于第三次AI发展高潮期之中,大计算能力和深度学习的出现是这次高潮的主要推动力,在逐步克服这两个问题后,自2006年以来人工智能飞速发展,其中2012年AlexNet的出现是一个分水岭,AlexNet 在当年的ImageNet图像分类竞赛中,top-5错误率比上一年的冠军下降了十个百分点,而且远远超过当年的第二名。
人工智能助力医疗
医疗资源不足和分配不均衡是困扰整个医疗卫生行业的重大问题,比如东西部的差别、城市和农村的差别,这几年的改革对基层医院已经有所加强,对医疗资源的建设主要是强基层、保基本,对乡镇卫生院的建设、对一百所卫生院的建设。但是医生是十分依靠经验的行业,很难批量化的培训和复制,而人工智能的成熟,能够为所有的医生带来医学专家的经验,从而对广大经验不足的医生带来巨大的助益。
今年全国两会上,“人工智能”被写入政府工作报告中,软件正在向人工智能+方向转变,目前无人驾驶、人脸识别、金融等领域都已经出现人工智能的身影,而有一个领域是我们所有人都离不开的—医疗,很多专家认为医疗是人工智能的最早实际应用的领域。
整个医疗行业复杂程度高,涉及知识面广,人工智能可以在多个环节发挥作用。比如:医学影像识别、生物技术、辅助诊断、药物研发、营养学等领域。
现在应用最为广泛的当属医学影像识别。最近几年,Nature、JAMA、Science等权威医学杂志上经常会出现人工智能解决医疗问题的论文,《“十三五”国家信息化规划》表示将推动健康医疗行业相关的人工智能发展。
人工智能在医学影像识别的应用上主要有三种方法:分类,检测和分割。分类可以将有病和正常的医学影像区分开来;检测可以识别出病灶并用框框出来;分割可以将病灶轮廓分割开来。每一种方法可以解决不同需求的问题,现在见到的医学影像识别产品都是采用这些方法。
如今,在我国医疗人工智能已经开始临床应用,张大磊在课上表示,Airdoc的产品已经开始在数十家顶级医疗机构和大量的基层医疗机构开始临床应用,并且已经走出国门。
今年5月份,Airdoc作为唯一一家中国人工智能企业,受邀参加微软Build2017全球开发者大会,是微软从140多个国家筛选出的最佳医疗案例。
人工智能是人类设计制造的一个产品,它应用到医疗领域是为了更好的辅助医生工具,人工智能可以通过海量医学知识和专家经验的学习,从而快速掌握并应用,从而可以帮助没有经验的医生,可以有效的辅助基层医院运转。而未来,可能有更快、更便宜的工具供医生使用。
医疗人工智能需要解决的问题
虽然现在医疗人工智能发展越来越成熟,但是在张大磊看来,这个巨大的市场仍然面临着很多问题需要大家面对和克服,他同时认为这是个长期的过程,无法在短期内快速得到解决。张大磊认为人工智能在医疗领域的主要问题包括:
一)数据质量问题:人工智能可以对人的意识、思维的信息过程进行模拟,可以像人一样思考,人工智能学习医生的经验就像我们上学时学习课本知识,因此数据的质量至关重要,医学数据中有很多无关的因素,比如清晰度,图片亮度、图片是否干净等,这些技术之外的因素如果不处理好,很可能产生数据污染。举个例子,如果数据质量不好,仪器的镜头有污渍,很可能会让仪器产生错误的认知,以为污渍是一种病灶,如果应用在临床会造成大量的误诊。
二)数据标注问题:人工智能数据处理中80%的时间都是在做数据预处理工作,标注的准确性关乎结果的准确性,但是医生是个性化很高的工作,对同样的病灶两个医生给出的诊断可能会不一样,谁对谁错很难分辨。为了解决标注的问题,Airdoc训练的每张图片都经过数名顶尖专家标注,投票选择相同的标注内容作为标准,张大磊认为,接下来两到五年之内,小样本学习在理论层面会获得足够的突破,近两年之内没有什么好的办法,还是要大量医生去标注。
三)算法方向选择问题:病人和医生交互越多环节,算法的质量越差。在医生的工作中,影像只是一部分,还有很多主诉和交流,但是目前人工智能尚处于弱人工智能阶段,并不能进行深入的沟通,比如中医的望闻问切都是交互,目前机器没有办法观察患者的面部表情,如果选择这个方面的算法,很可能会丢失很多信息,从而对算法的准确率产生印象。因此选择辅助分析算法的时候需要选择更少沟通,更客观的方向。
四)监管问题:医疗技术监督管理是卫生监督体系的主要组成部门,是规范医疗服务市场秩序的重要手段和方式,而人工智能刚刚应用到医疗领域,很多监管政策还没有制定,在接下来的发展过程中一定会遇到医疗监管的问题。此外技术发展以快速著称,算法是可以自主更新的,但是医疗领域又是以安全为基础,如果算法更新,准确率提高的部分又需要重新认证。
五)市场培养:医疗被认为是人工智能最早落地的领域,但是医疗的特殊性对产品的要求会更高,从认识到被接受再到相应支付体系的完善,以及到医保的接入,都需要一个很长的过程。
推动行业健康发展
随着人工智能、大数据等相关应用与理念的不断传播,越来越多曾经深入人心的观念被彻底撼动,但是在医疗领域因其特殊性,很难像其他领域一样容易获取数据。
张大磊特别强调了数据安全的问题,在算法的研发过程中,很多信息都是没有必要的,同时需要保护患者的隐私,因此需要对数据进行脱敏处理。
HIPAA是美国前总统克林顿签署的健康保险携带和责任法案,该法案对多种医疗健康产业都具有规范作用,包括交易规则、医疗服务机构的识别、从业人员的识别、医疗信息安全、医疗隐私、健康计划识别、第一伤病报告、病人识别等。
做为医疗领域领军企业的Airdoc,做了一些力所能及的努力,希望可以推动人工智能在医疗领域的健康发展,Airdoc目前所有的数据和产品都是遵循HIPAA法案,张大磊呼吁同行遵循HIPAA,大家共同保持患者隐私。
|