首页 > 新闻公告 > 通知公告 > 正文

2017年乳腺疾病泉城论坛讲课精选之 山东师范大学 孙建德教授

来源: 时间:2018-01-31 08:32:16

摘要:数据驱动的智能医学研究山东师范大学 孙建德教授首先非常感谢论坛和余主任邀请我来给大家介绍一下相关方面的一些内容。就像董老师介绍的一样,我和乳腺的关系感觉很远的一个学科过来的。我起初是...

数据驱动的智能医学研究
山东师范大学 孙建德教授

首先非常感谢论坛和余主任邀请我来给大家介绍一下相关方面的一些内容。就像董老师介绍的一样,我和乳腺的关系感觉很远的一个学科过来的。我起初是做信号与信息技术一类的,到2010年以后开始做计算机科学方面的研究。对于肿瘤和乳腺方面,我是外行,但是我也想从计算机学科来说,近几年,计算机学科和医学之间的结合越来越多。有很多计算机学科的专家往医学方面走来服务医学,我就从这个角度,从数据驱动的一个方面来看一下,计算机科学在智慧医疗和智能医疗他们之间的一个联系。

我们知道,从2008年开始,很多人都比较熟悉,智慧地球这样一个概念。但是里面也包含了一直在说的智慧城市、智慧电信、智慧银行、智慧零售等等,也包含了我们所说的智慧医疗。在这样一个智能的社会当中,我觉得智慧医疗是一个非常重要的部分,这是一个不可或缺的一部分。那么对于智慧医疗的定义,如果我们从网上查一查,百科对它是从两个方面来定义的。这个呢也是我们医疗和计算机领域结合发展的两个阶段。第一个就是:智慧医疗是打造一个健康的医疗信息平台,要利用互联网的技术,实现患者和医务人员的互通,医疗机构的互通,医疗设备的互通,达到信息化。我觉得这是我们的第一个阶段。第一个阶段,从我们数学的角度来说,这就是数据的交换和数据的交流,以及数据的电子化从属。我想现在咱们医疗发展的阶段里面,信息化我们已经达到的非常好,包括一些基于手机、基于移动终端的应用。那么第二个阶段,就是我们要融入更多的人工智能和传感技术的科技。让医疗服务走向真正的智能化。这就是我们今天所说的智能化。我觉得以前我们对于智能医疗的了解,从医疗角度来说,更多的讨论或者强调的是信息化,而我们现在更多的是要强调的从信息化走向智能化。那么信息化,我们简单的举一个例子,我下面举的例子基本都是国内的例子,这个就是我看到关于平安万家医疗云诊所的系统。在这个系统里面,我们看到整个是一个信息化的体现。包括病人的信息,病人的辅助,以及在日常的长期的监护或者预防阶段的监护。这些信息放到信息系统里面,这就是初级阶段的智能应用。如果我们计算机学科提到智能医疗,更关注的是智能这个方面。那么智能这个方面,我们有个比较典型的例子:谷歌。这个公司呢,大家不管是不是知道计算机科学的,都应该有了解。那么谷歌在2019年的时候预测一个事情。这个从数据的角度来预测,H1N1流感的爆发趋势,爆发的人数,这样的一个公司。那么这个数据,它仅仅是通过我们计算机的用户从网上搜关于H1N1流感,它的症状是什么,它应该如何去治疗,通过这样一些数据的搜索,来准确的在2019年预计到H1N1这样一个流感爆发的情况。那么这个事情,我们想说明什么问题呢,一个就是说,通过这种数据的分析,我们可以预测得到一些医疗上的片段,第二个,这个事情的后期就是,在12年到13年,它的预测失准了,到以后,他的数据也就无法复制。那么我们觉得原因是什么,从数据的角度来说,第一个,它使用数据有失偏颇。它是在某一个方面比较集中,而不是一个全面表述疾病的数据。第二个方面,它缺少了医疗专家的介入。这就是我们计算机学科在和医疗结合的时候,我们需要注意的一些问题。那么对于我们来说,智能医疗,举两个例子,特别是现在我们对于影像比较关注的,第一个例子呢,我们大家都知道有一个叫Doctor you,这是一个临床医学的科研型平台,包括医学辅助检测,它是通过搜集大量的数据,来对诊断做出辅助的判断,同时也来辅助一些医师来尽快的提高医师的能力。另外一个就是腾讯觅影,它就是利用咱们得到的医学影像,来进行早期医学的判断,特别是食管癌,乳腺癌,宫颈癌等等。前几天也有中科院和研究所的机构也提出来,通过呼吸的方式,吹一吹气,就可以在几秒钟判断,是不是患有宫颈癌或者是预测到宫颈癌患病的几率。这些就是通过数据的采集、判断,通过计算机的手段来进行医疗的诊断或者是辅助诊断。这就是我们计算机学科对于智能的认识。就是诊断的自动化。那么作为智能呢,从计算机学科我们得到的概念就是人工智能,现在比较火的一个词汇。那么提到人工智能呢,在计算机里我们不得不提到这样一个人和这样的一件事情,这个人是一位斯坦福的教授——李飞飞。她是一个华人,她发起了一个竞赛,这个竞赛叫ImageNet。这个竞赛的目的就是要人教计算机怎么去认同事儿。整个我大概介绍一下,也和我们医疗比较相关的就是,它开始设定了非常多的图像数据,然后她的学生、她的团队甚至全球发起了这样一个活动。这是一个什么事儿呢,就是标注:我这个图像是什么、另外一个图像是什么,标注了很多类的图像。那么这样的一个活动之后,有了图像的数据,有了图像的数据标注它是什么,然后加上计算机学科的机器学习的方法,咱们现在一个比较火的词叫深度学习。那么计算机就能够判断出来,你再输入一个图像,它就知道这是一个什么样的图像。这就叫人教计算机如何理解图像。那么智能医疗,其实就是人在教计算机怎么做出医学上的判断,换句换说呢,就是从医疗的数据方面我们提取出信息来,当然现在的信息呢,有文本记录的,有图像记录的,通过这种信息的融合和抽取,形成知识。随后这种知识应用到我们医疗上,进行判断的辅助也好,进行一些靶位的锁定也好,等等。当然我们说在智能医疗方面,我们现在关注的热点还主要是医疗影像。但这种医疗影像怎么判断呢?在最新颁布的一个新一代的人工智能产业,三年计划当中,它也是8个重点研究方向的其中一个。就是基于影像来做辅助判断。那么我们说智能医疗,或者用计算机来做这些事情,所涉及到的好处,就是说没有情绪的干扰,它只针对数据来做,它的自我学习能力比较强。前一阵在网上看到一篇帖子,我需要用8-10年培养一个好的医生,可以去做精准的判断,那么多长时间能培养一个计算机呢?你的数据放在那里,它不需要休息,就可以进行学习,这种使得计算机具有初步的医疗判断能力的成本和时间,相对于培养医生来说,还是比较低的。

那么对于我们提到的智能医疗来说,我们认为计算机和医疗的结合,往往达到3个层面。第一个层面:看得清。这个也是早期的计算机学科和医疗学科结合的时候,我们期望得到的结果。这是一个颈部动脉的图像。这是融合了这几幅图像得到的颈部动脉的图像,也就是说,我们有了一定量的数据,我们把数据融合到一块,就可以把他们之间相互拥有的差异性相互补充起来,进行呈现。那么这种呈现就使得我们在获取数据的角度相互补充,得到更高分辨率的图像。让医生也能够看得清楚,做出比较正确的依据来。这个阶段我们把数据叫做数据大,而不是大数据。那么数据大,就是说数据的量比较大,有了大量的数据,我们才能从大量的数据融合信息。

第二个阶段:读的懂。给出这样一个图像,那么这个图像是什么呢,里面有什么东西,我根据它能做什么事情。首先呢,我们可以定位。这是一个癌症区域的靶位,我们可以把它锁定,并且我们可以根据注射进去的药物扩散速度和扩散的方向来对过程进行建模。通过这种建模来探究癌症发病的机理,或者作出一些相应的判断。这个时候就需要大数据。这里面数据量大,并不是大数据,这就是我刚才在第一个问题中说到的,谷歌它的这种判断。一开始是2009年,它做的这种判断非常准,我们说它收集了大量的数据,但是这种数据随着时间的推移,它的数据存在了偏差,它不能全面的描述整个事情或者整个病理的特性,那么这个数据只能说是量大,而不能是大数据。它只是分布上的某一个方面比较多。所以通过这样一个全面的分析之后,就能够得到一个我们读懂这个图像,这个图像是什么,我们能够通过这个影像数据分析到什么。

第三个阶段:判得准。这个是在我们得到大量数据之后,对数据进行标注,这个是我们当时做精神分裂症的判断。当然在其他的比如说阿尔茨海默病等等也有成像方面的东西。通过正常人和情感分裂的患者他们图像数据的对比和标注,就是由医疗人员对他们说这是正常的,这是有情感分裂的,他的程度是什么,有了这种标注之后,这种数据的建立,就是通常所说的真正的大数据。没有数据标注的,对于计算机学科的研究者来说,它只是一种数据,很难得出有价值的医疗判断。从数据的角度来说,作为一个计算机学科的人,来和医学的专家结合的时候,我们需要这么几个层次。

通过上面的介绍,那么医疗数据该是个什么样子呢,我们首先从信息的角度来说,我们要有信息的采集。那么这种信息的采集,从病例上来说,从日常的体检也好,包括平时我们可穿戴的设备也好,包括手环,甚至是带有传感器的衣服,这种生命体征的实时监测,这都是数据的采集。那么这种数据的采集,经过一些处理,去掉一些所谓的“噪声”,一些有错误的东西,这就是处理和标准化,它才能进行分析。那么这种分析系统里面,就加入医生的判断和标注,不断地行形成;包括基因预测和干预,包括生活方式等等。这个方式我们再进行接待,这就是整个系统或者框架的自学习的过程。不断的学习和提升,就像咱们人一样,一开始学到的东西,通过不断地实践,校正,再去不断地提升,最后得到的一个精准的模型,来实现对于疾病的认知。因此我们看 IBM作为蓝色巨人,他从8年前提出智能地球,到现在它的概念也发生了改变,这叫做认知计算。其实我们整个过程根据数据来做出判断,来最终形成支持,就像人从小长大,到某一个行业从业之后,这么一个认知的过程。那么对于这个过程,我们想去实现它,我觉得从计算机学科研究的角度来说,我们有几个事情要做。第一:要把数据计算。包括我们之前和余主任团队交流的时候,我们很多的数据,结构非常混乱,并且他的记录是大量的非结构化数据,甚至有很多的重复数据,并不能进行比较好的表征。只有数据有了比较好的表征,它才能够成为可计算的,才能够被计算机学科利用。当然从我们本学科来说,即使是图像、视频、声音等数据,它的标准化,它的结构化,也是现在国家正在做的非常重要的一个方面。我觉得作为医疗数据的结构化和标准化,可能也是一个非常重要的,需要我们去考虑的。第二就是人工智能。在我们这个领域里面经常开玩笑说:人工智能就是人工加智能。所谓的人工,就是专家的参与,和专家的标注。 只有有了标注的数据它才是有价值的。特别是在现阶段计算机学科的研究来说,无标注的数据,对计算机学科来说,我们只能做大概的分类,很难做出准确的判断。这种标注,我们接触到的数据当中,比如说肺结节,普通的标注是结节的位置在哪,结节的大小怎么样,形态是什么样的。那么如果有专家的介入,再从病理的角度进行一些标注,比如说结节和肿块周围的情况是什么,它肺内转移的情况是什么等等,这些信息加进去之后,信息加的越详细,计算机通过学习的方式得到的结也会越准确,辅助的作用也会越大。另外一个就是说,从数据到价值。根据采集到的数据形成知识的过程。这个过程当中,我们有两个方面的考虑。一方面,一个好的大夫他做出判断的时候他不仅仅是看我们的影像资料,他可能还要看你的病例,还要问日常的生活习惯,他是一个数据和历史经验的结合。因此,好的大夫是不能被计算机所取代的。那么怎样让计算机达到好的大夫的水平?其实就是把各方面的知识都调动起来,结合到学习的决策模型当中。这就是知识的加入。这个也是计算机学科在提升计算机能力的研究过程当中,正在研究的一个热点。另外一个方面,它是由多元的数据,我们所说的多元数据是由影像数据,这是我们现在非常关注的,很多人都在做这个方面的。另外一个方面就是以后我们能够涉及到的,现在很多的研究是从日常的生活习惯,饮食习惯,起居习惯等等,综合研究这些因素对于整个身体健康或者疾病的效果。那么这些数据记录的形式,所表达的形式,各个图像是有很大差别的。因此我们说这是一种异构化数据,甚至是异构化数据之间的信息补充。
从数据上来说,我对于医疗上的认识,针对这种智能医疗来说,以后可能就是互联网加人工智能的方式。特别是现在这种便携式的人体信息的采集设备越来越多的时候,智能的衣服,手环甚至是非接触式的生命体征采集,最后综合起来得到这种实时的数据传接到监控平台,可以实时的做出判断。这就是所说的智慧医疗或者智能医疗的形式。其中包含了信息的采集,信息的处理和分析,最终医生和病人之间交流。这就是我的一点疏浅的意见,希望各位专家批评,谢谢。

专家门诊时间

乳腺外科门诊位于门诊楼3楼A段西侧外科门诊区,全年专家坐诊,具体专家门诊时间表如下:

时间 专家
星期一 傅勤烨
星期二 张强
星期三 高德宗
星期四 李亮
星期五 李玉阳
星期六
星期日

乘车路线

山大二院乳腺外科乘车路线

地址:济南市天桥区北园大街247号

电话:0531-85875374

乘车路线:南临大明湖,西面是济南火车站和长途汽车总站,交通便利。

1695667043
222971539
0531-85875374
关闭