首页 > 科技未来 > 内容

陈润生院士：人工智能和大数据如何催生精准医疗？

发布于：2024-06-17 编辑：匿名来源：网络

11月1日，在新华网、南京市经济和信息化委员会主办的首届中国智慧谷大会人工智能与产业创新高峰论坛上，中国科学院院士、生物信息学家陈润生发表题为《《大数据与精准医学》的讲话。

陈润生院士认为，人工智能、大数据等技术在医疗领域的应用，将推动精准医疗的发展，在疾病发生前采取针对性措施，从而改变医疗健康理念。

同时，人工智能和大数据在研究我们遗传信息中97%我们尚未了解的“暗物质信息”方面也发挥了关键作用。

总体来看，精准医疗才刚刚起步，还有很多机会。

以下为陈润生院士演讲全文。

雷锋网根据现场录音进行了编辑，不改变原意：尊敬的各位专家、各位领导，非常荣幸参加这次会议。

今天我想分享一下我对大数据和精准医疗的看法。

，因为现在大家都知道精准医疗非常流行。

虽然与人工智能相比它还是个小弟，但我们知道，2020年1月20日，奥巴马总统宣布美国将开展精准医疗研究。

自此，精准医疗受到了全世界的广泛关注。

在包括我国在内的很多发达国家，不仅是大家都关心的领域，我国领导人也多次对精准医疗的发展做出了重要指示，并在资金投入等方面做出了重要指示。

也有具体的表现。

那么今天我主要讲一下精准医疗的四个方面。

一是跟大家交流一下，希望能够展开一些讨论。

1.精准医疗是组学大数据与临床医学的结合。

第一个问题是，精准医疗的本质和核心是什么？我看到国内关于精准医疗内涵的讨论有各种各样的评论。

有不同的意见。

我个人觉得精准医疗的核心其实就一点。

很明显，这就是组学大数据和医学的结合。

更具体地说，是组学大数据与临床医学的结合。

也就是说，组学大数据应该应用于临床医学，提高医学诊断的准确性，提高治疗的有效性。

这里有两层含义，一是组学大数据，二是医学。

那么组学大数据包括两层含义，一是组学，二是大数据。

我们知道，近年来，随着临床研究的发展，我们获得了越来越多以基因组为代表的分子水平的人类信息。

，这在之前是前所未有的。

那么随着以基因组为代表的组学数据的发展，人们积累了越来越多以遗传密码为代表的信息，不仅仅是基因信息，还有蛋白质信息。

后来人们发现，挖掘这些未来我们会得到很多反映人类健康和疾病的信息。

因此，有人提出，如果将这一信息应用于临床，临床效果肯定会得到提高。

这就是所谓精准医疗的本质意义。

然而，仅仅获得有关这些遗传密码的信息是不够的。

众所周知，所有的遗传密码信息都是一个非常大量的大数据。

这些大数据很容易测量。

我们现在知道，在我们国家，每个人花一万元就可以得到你的基因信息。

密码，但是当你得到你的遗传密码时，你根本不理解它，因为它只有四个字母（A，C，G，T），所以要理解它，你必须发展大理论方法和技术数据分析。

因此，为了在大型临床环境中使用这些组学数据，必须是组学数据和大数据分析方法的结合。

所以一部分是组学大数据，一部分是医学。

两者的结合构成了当今精准医学的本质和核心。

这是第一个问题。

关于精准医学的本质，他还表示，自20世纪90年代以来，组学数据开始应用于临床，并发展为转化医学和个性化医学。

现在，精准医学这个名字已经被创造出来了，但无论如何，它的本质是明确的，那就是组学大数据在临床医学中的应用。

2、精准医疗有可能改变医疗健康的基本理念。

第二个问题：精准医疗能给医学带来哪些本质的改变？我认为，如果精准医疗只是提高了医疗水平的一小部分，那么精准医疗不一定会引起更多领导人的关注。

就精准医疗的内涵而言，必然有一些本质的改变。

那么这些本质性的改变是什么？我们也可以用一句话来表达。

精准医疗引起各国领导人关注的本质在于，精准医疗有可能改变医疗健康的基本理念。

也就是说，可以推动医疗基本理念从目前的诊疗向健康保障转变。

我们知道现在的医疗体系是面向患者的，所以主要是给患者提供所谓的治疗。

但是，未来，由于精准医学的发展，以及组学大数据的介入，此时的健康不仅是针对患者，而是针对整个人群，针对任何人，当他没有生病的时候，我们衡量他的组学数据并分析组学大数据，然后我们可以评估他未来健康发展的危险因素。

根据评估，适当的干预将预防某些疾病的发生，减轻某些疾病的严重程度，并提高他们的生活质量。

这将推动整个医疗卫生体系向前发展，为疾病消失之前提供评估和保障。

（未来医学的三大趋势）有人认为，这种根本性的观念转变可能会导致一些新兴产业的出现。

有人预测，这种与所谓精准医疗相关的概念转变所产生的新型新技术可能会在2020年开发出来。

这一变化为2000亿美元，相当于近2万亿元人民币，这将对GDP产生影响。

这种精准医疗带来的自然观念的改变以及由此带来的产业发展，必将引起各国领导人的关注。

这是第二个方面，对精准医疗可能带来的一些本质变化的预估。

精准医学研究已成为新一轮国家科技竞争和引领国际战略的制高点。

大家都知道美国想要测量所有自然人的遗传密码，欧盟也在积极推动所谓精准医学的研究，包括英国、法国等，日本也在进行投资和计划与精准医疗相关。

那么我们该如何认真分析精准医疗，又如何能够推动行业变革和发展呢？我认为至少有四个方面：第一个可以促进海量生物样本库和数据库的发展。

众所周知，由于精准医疗的推广，需要测量数百万人的组学信息。

首先涉及从数百万人中采集、储存、提取和提供生物样本。

这当然是一个大产业。

同时，经过对这些样本的测试，数据量达到了百万人的量级，这必然会促进相应的大型数据库的发展。

有人估计，这个产业的规模可能在数百亿数量级。

其次，有了这些样本，我们需要测量基因组所代表的组学数据，所以我们需要测量基因组、蛋白质组、转录组。

仅2018年，这些测序数据就将达到1亿美元的规模。

那么有了样本库和组学数据的测量，下一步就可以基于这些海量数据的挖掘，推动大量新的分子诊断指标的产生。

我们知道将会添加很多与疾病相关的信息，其中很多信息可以用作新疾病的标记。

同时，还可以发现很多新的药物设计靶点，从而带动第三产业，也就是所谓的分子诊断和药物设计靶点的相关产业。

第四个当然是以精准医疗理念打造的新型医疗设施。

例如，将建立一些健康来源和一些健康从业人员。

这些都是可以和现在的医院、医生相关的行业，这个数量大概是1000亿。

这个行业必然会带来变化，这一点在中国已经得到体现，数百家小公司逐渐成立。

当然，他们如何才能更好地发展还有待讨论。

（精准医疗将带动基因测序、分子诊断、个性化治疗等市场规模的扩大）我国的精准医疗发展目标我就不多说了。

它们与国际上的一致。

第二个方面，精准医疗能带来什么？本质的改变，如何推动产业发展，哪些产业可以通过发展来带动或引导。

3、如何准确？我想问的第三个问题是，要实现精准医疗需要做什么？为了达到准确度，必须达到哪些点？所以我认为精准医疗至少要满足两个条件。

首先要有组学大数据的基础。

我们知道精准医疗就是将组学大数据运用到临床中，所以第一个就是获取组学大数据。

大数据就是获取基因组、蛋白质组、代谢组、代谢组等组学数据，数据本身是没有用的。

第二步是挖掘组学数据。

挖矿将使用大数据。

数据分析的理论方法包括刚才张波院士提到的人工智能方法、深度学习方法等。

基于知识的方法用于挖掘这些组学，以获得分子水平上与疾病相关的知识。

这是第一个基础。

（精准医学基础）这些分子知识、组学知识应用到临床疾病中，还必须建立第二个基础，就是在分子水平上构建以基因型为代表的信息核心。

建立了这个桥梁之后，才能够在分子水平上有效地转化信息，并将其应用到疾病的诊断和治疗中，那么这就是建立所谓的生物信息学、生物网络、系统生物学等，有了这两个基础，我们能够更好的实现精准医疗，当然，很重要的一点就是精准医疗的发展，应该和现在的临床影像、临床生化检测、现在的临床知识很好的结合起来。

这不是一些公司其他测试的顺序。

一切都已经决定了，但事实上却并非如此。

应该更好地结合起来以获得更好的准确性。

精准医学只是将新数据应用到原始数据上，以做出更好的改进。

4.精准医疗才刚刚开始。

第四章提到的精准医疗第四阶段现在处于什么阶段，发展到什么阶段了？大家都知道，也许现在精准医疗已经成为一个热词，大家都认为现在什么事情都可以做到精准，医学很容易变得精准。

从我个人的角度来看，虽然精准医疗实际上可能会带来本质的改变，但它可能会带来新的发展。

行业的发展或许规模巨大，但才刚刚开始，才刚刚开始！为什么？在精准医疗的理念下，我们仍然面临着巨大的挑战和困难。

因此，我下面举一两个例子来说明目前骨科医学存在什么样的困难？为什么精准医疗才刚刚开始起飞？我们创新的机会在哪里，挑战在哪里？我只给你举一个组学的例子。

在我们的临床代码和组学中，仍然存在很多暗信息。

所谓我们自己的遗传密码目前只是我们能够定期分析的。

目前还无法分析的一小部分就是基因组中所谓的暗信息。

我们每个人的遗传密码信息是3*10的9次方。

如果装订成一本书，一页三千字，一页装订层，就是一万本书。

如果一万本书每本长一厘米，那么我们自己的遗传密码书就有一百米长。

你可以想象你自己的遗传密码离地面有四十层楼那么高。

如果你能读懂所有内容，那么你是准确的。