首页 > 科技未来 > 内容

陈润生院士:人工智能和大数据如何催生精准医疗?

发布于:2024-06-17 编辑:匿名 来源:网络

11月1日,在新华网、南京市经济和信息化委员会主办的首届中国智慧谷大会人工智能与产业创新高峰论坛上,中国科学院院士、生物信息学家陈润生发表题为《 《大数据与精准医学》的讲话。

陈润生院士认为,人工智能、大数据等技术在医疗领域的应用,将推动精准医疗的发展,在疾病发生前采取针对性措施,从而改变医疗健康理念。

同时,人工智能和大数据在研究我们遗传信息中97%我们尚未了解的“暗物质信息”方面也发挥了关键作用。

总体来看,精准医疗才刚刚起步,还有很多机会。

以下为陈润生院士演讲全文。

雷锋网根据现场录音进行了编辑,不改变原意:尊敬的各位专家、各位领导,非常荣幸参加这次会议。

今天我想分享一下我对大数据和精准医疗的看法。

,因为现在大家都知道精准医疗非常流行。

虽然与人工智能相比它还是个小弟,但我们知道,2020年1月20日,奥巴马总统宣布美国将开展精准医疗研究。

自此,精准医疗受到了全世界的广泛关注。

在包括我国在内的很多发达国家,不仅是大家都关心的领域,我国领导人也多次对精准医疗的发展做出了重要指示,并在资金投入等方面做出了重要指示。

也有具体的表现。

那么今天我主要讲一下精准医疗的四个方面。

一是跟大家交流一下,希望能够展开一些讨论。

1.精准医疗是组学大数据与临床医学的结合。

第一个问题是,精准医疗的本质和核心是什么?我看到国内关于精准医疗内涵的讨论有各种各样的评论。

有不同的意见。

我个人觉得精准医疗的核心其实就一点。

很明显,这就是组学大数据和医学的结合。

更具体地说,是组学大数据与临床医学的结合。

也就是说,组学大数据应该应用于临床医学,提高医学诊断的准确性,提高治疗的有效性。

这里有两层含义,一是组学大数据,二是医学。

那么组学大数据包括两层含义,一是组学,二是大数据。

我们知道,近年来,随着临床研究的发展,我们获得了越来越多以基因组为代表的分子水平的人类信息。

,这在之前是前所未有的。

那么随着以基因组为代表的组学数据的发展,人们积累了越来越多以遗传密码为代表的信息,不仅仅是基因信息,还有蛋白质信息。

后来人们发现,挖掘这些未来我们会得到很多反映人类健康和疾病的信息。

因此,有人提出,如果将这一信息应用于临床,临床效果肯定会得到提高。

这就是所谓精准医疗的本质意义。

然而,仅仅获得有关这些遗传密码的信息是不够的。

众所周知,所有的遗传密码信息都是一个非常大量的大数据。

这些大数据很容易测量。

我们现在知道,在我们国家,每个人花一万元就可以得到你的基因信息。

密码,但是当你得到你的遗传密码时,你根本不理解它,因为它只有四个字母(A,C,G,T),所以要理解它,你必须发展大理论方法和技术数据分析 。

因此,为了在大型临床环境中使用这些组学数据,必须是组学数据和大数据分析方法的结合。

所以一部分是组学大数据,一部分是医学。

两者的结合构成了当今精准医学的本质和核心。

这是第一个问题。

关于精准医学的本质,他还表示,自20世纪90年代以来,组学数据开始应用于临床,并发展为转化医学和个性化医学。

现在,精准医学这个名字已经被创造出来了,但无论如何,它的本质是明确的,那就是组学大数据在临床医学中的应用。

2、精准医疗有可能改变医疗健康的基本理念。

第二个问题:精准医疗能给医学带来哪些本质的改变?我认为,如果精准医疗只是提高了医疗水平的一小部分,那么精准医疗不一定会引起更多领导人的关注。

就精准医疗的内涵而言,必然有一些本质的改变。

那么这些本质性的改变是什么?我们也可以用一句话来表达。

精准医疗引起各国领导人关注的本质在于,精准医疗有可能改变医疗健康的基本理念。

也就是说,可以推动医疗基本理念从目前的诊疗向健康保障转变。

我们知道现在的医疗体系是面向患者的,所以主要是给患者提供所谓的治疗。

但是,未来,由于精准医学的发展,以及组学大数据的介入,此时的健康不仅是针对患者,而是针对整个人群,针对任何人,当他没有生病的时候,我们衡量他的组学数据并分析组学大数据,然后我们可以评估他未来健康发展的危险因素。

根据评估,适当的干预将预防某些疾病的发生,减轻某些疾病的严重程度,并提高他们的生活质量。

这将推动整个医疗卫生体系向前发展,为疾病消失之前提供评估和保障。

(未来医学的三大趋势)有人认为,这种根本性的观念转变可能会导致一些新兴产业的出现。

有人预测,这种与所谓精准医疗相关的概念转变所产生的新型新技术可能会在2020年开发出来。

这一变化为2000亿美元,相当于近2万亿元人民币,这将对GDP产生影响。

这种精准医疗带来的自然观念的改变以及由此带来的产业发展,必将引起各国领导人的关注。

这是第二个方面,对精准医疗可能带来的一些本质变化的预估。

精准医学研究已成为新一轮国家科技竞争和引领国际战略的制高点。

大家都知道美国想要测量所有自然人的遗传密码,欧盟也在积极推动所谓精准医学的研究,包括英国、法国等,日本也在进行投资和计划与精准医疗相关。

那么我们该如何认真分析精准医疗,又如何能够推动行业变革和发展呢?我认为至少有四个方面:第一个可以促进海量生物样本库和数据库的发展。

众所周知,由于精准医疗的推广,需要测量数百万人的组学信息。

首先涉及从数百万人中采集、储存、提取和提供生物样本。

这当然是一个大产业。

同时,经过对这些样本的测试,数据量达到了百万人的量级,这必然会促进相应的大型数据库的发展。

有人估计,这个产业的规模可能在数百亿数量级。

其次,有了这些样本,我们需要测量基因组所代表的组学数据,所以我们需要测量基因组、蛋白质组、转录组。

仅2018年,这些测序数据就将达到1亿美元的规模。

那么有了样本库和组学数据的测量,下一步就可以基于这些海量数据的挖掘,推动大量新的分子诊断指标的产生。

我们知道将会添加很多与疾病相关的信息,其中很多信息可以用作新疾病的标记。

同时,还可以发现很多新的药物设计靶点,从而带动第三产业,也就是所谓的分子诊断和药物设计靶点的相关产业。

第四个当然是以精准医疗理念打造的新型医疗设施。

例如,将建立一些健康来源和一些健康从业人员。

这些都是可以和现在的医院、医生相关的行业,这个数量大概是1000亿。

这个行业必然会带来变化,这一点在中国已经得到体现,数百家小公司逐渐成立。

当然,他们如何才能更好地发展还有待讨论。

(精准医疗将带动基因测序、分子诊断、个性化治疗等市场规模的扩大)我国的精准医疗发展目标我就不多说了。

它们与国际上的一致。

第二个方面,精准医疗能带来什么?本质的改变,如何推动产业发展,哪些产业可以通过发展来带动或引导。

3、如何准确?我想问的第三个问题是,要实现精准医疗需要做什么?为了达到准确度,必须达到哪些点?所以我认为精准医疗至少要满足两个条件。

首先要有组学大数据的基础。

我们知道精准医疗就是将组学大数据运用到临床中,所以第一个就是获取组学大数据。

大数据就是获取基因组、蛋白质组、代谢组、代谢组等组学数据,数据本身是没有用的。

第二步是挖掘组学数据。

挖矿将使用大数据。

数据分析的理论方法包括刚才张波院士提到的人工智能方法、深度学习方法等。

基于知识的方法用于挖掘这些组学,以获得分子水平上与疾病相关的知识。

这是第一个基础。

(精准医学基础)这些分子知识、组学知识应用到临床疾病中,还必须建立第二个基础,就是在分子水平上构建以基因型为代表的信息核心。

建立了这个桥梁之后,才能够在分子水平上有效地转化信息,并将其应用到疾病的诊断和治疗中,那么这就是建立所谓的生物信息学、生物网络、系统生物学等,有了这两个基础,我们能够更好的实现精准医疗,当然,很重要的一点就是精准医疗的发展,应该和现在的临床影像、临床生化检测、现在的临床知识很好的结合起来。

这不是一些公司其他测试的顺序。

一切都已经决定了,但事实上却并非如此。

应该更好地结合起来以获得更好的准确性。

精准医学只是将新数据应用到原始数据上,以做出更好的改进。

4.精准医疗才刚刚开始。

第四章提到的精准医疗第四阶段现在处于什么阶段,发展到什么阶段了?大家都知道,也许现在精准医疗已经成为一个热词,大家都认为现在什么事情都可以做到精准,医学很容易变得精准。

从我个人的角度来看,虽然精准医疗实际上可能会带来本质的改变,但它可能会带来新的发展。

行业的发展或许规模巨大,但才刚刚开始,才刚刚开始!为什么?在精准医疗的理念下,我们仍然面临着巨大的挑战和困难。

因此,我下面举一两个例子来说明目前骨科医学存在什么样的困难?为什么精准医疗才刚刚开始起飞?我们创新的机会在哪里,挑战在哪里?我只给你举一个组学的例子。

在我们的临床代码和组学中,仍然存在很多暗信息。

所谓我们自己的遗传密码目前只是我们能够定期分析的。

目前还无法分析的一小部分就是基因组中所谓的暗信息。

我们每个人的遗传密码信息是3*10的9次方。

如果装订成一本书,一页三千字,一页装订层,就是一万本书。

如果一万本书每本长一厘米,那么我们自己的遗传密码书就有一百米长。

你可以想象你自己的遗传密码离地面有四十层楼那么高。

如果你能读懂所有内容,那么你是准确的。

我相信没有人能够准确的说出来。

我现在要告诉大家的是全世界科学家的智慧,包括生物医学科学家的智慧。

这本书中能从规则上理解的部分只有遗传密码的3%,其余的97%其实目前全世界的智慧都还看不懂。

到目前为止,我们 97% 的遗传密码都是黑暗的。

陈润生院士:人工智能和大数据如何催生精准医疗?

我想在下面给你一些扩展的解释。

(科学杂志《10年新世纪杰出发现》:遗传暗物质)首先,从遗传密码的角度来看,我们实际上并没有从整体和常规角度理解我们97%的遗传密码。

看法。

,我们知道的3%是大家从中学就知道的蛋白质信息。

3%是制造蛋白质的遗传密码。

我们知道它的分类和信息,但其余 97% 的遗传密码与制造蛋白质无关。

到目前为止,我们还不知道它有什么用。

这就是遗传密码中所谓的暗物质,也是遗传密码中的非编码序列。

那么这个概念,大家可以想一想,当我们测量遗传密码而97%的密码是未知的时候,我们如何才能做到准确呢?所以距离准确还有很长的路要走。

(不同生物体基因解码的程度)进入21世纪,科学家们对占人类基因组97%的我们仍不了解的暗物质遗传密码提出了质疑。

有转录产品和信息发布吗?换句话说,他是否活跃并发挥作用?这个结果是%确定的。

这些非编码序列与我们用来制造蛋白质的基因相同。

它们无时无刻不在表达,无时不在发挥作用,因此也真正完成了生物学功能。

所以这些东西我可以举几个例子来说明它和肿瘤的关系。

当然,虽然我们不能全部了解,但还是有一些零碎的例子可以说明它的生物学功能。

比如97%有这样一个产品,它叫PCGEM1,它会导致前列腺癌,而且不是由蛋白质引起的。

还有MALAT-1,可引起非小细胞肺癌。

众所周知,肺癌在我国呈快速增长趋势。

我们现在的临床医院,用来检测肿瘤的指标都是我提到的3%,治疗的目标是用的药物也是针对3%的。

现在我告诉你,97%。

有很多例子证明它们也与肿瘤有??关,但从未纳入我们的临床诊断和治疗范围。

您认为这个肿瘤可以治愈吗?好的?你没有考虑到它,当然你也没有想到去检测和治疗它。

也就是说,到目前为止,我们还有97%的与疾病状况相关的东西没有纳入我们的诊断和治疗视野中。

这就是精准医学面临的所谓组学。

暗信息的巨大挑战。

(长链非编码MALAT-1 RNA与肺癌的关系)我们知道,(遗传暗物质信息的)97%与我们的疾病和健康密切相关。

有多少这样的密码我们还没有发现?我们大约有 0 个基因。

在这97%中,我们现在可以评估一下他有多少原创吗?由于伦理原因,我们还不了解人类。

遗传学研究所对老鼠做了研究,并带来了所有原件。

不管你是编码还是非编码,总共找到了 181,000 个。

这是在老鼠身上。

实际执行功能的原件的下限实际上必须大于该值。

这里发现,产生意义的原件中的3%决定了20,000个原件。

换句话说,我们仍然有 97% 的 161,000 个(非编码 RNA),这 161,000 个。

据我所知,世界各地的科学家已经分析了大约1000个。

也就是说,还有16万个机会。

一些非常重要的组件功能有太多的机会。

发现。

这两个人属于这些领域97%的研究人员。

我曾经开过一个玩笑。

如果算一下,2018年3%的研究就造就了约50名诺贝尔奖获得者。

现在我们知道还有97%。

97比3,差不多了,所以我们在这个领域有一千多个机会做出诺奖级别的原创特殊贡献,而且只有一个名额,所以我们还有很大的机会。

(大量的非编码RNA蕴含着很多机会。

)所以,从精准医学的角度来看,我们现在其实还不能做到精准,因为有一个巨大的大数据,这只是意味着它的内涵还没有被挖掘出来。

但另一方面,它也可以为我们提供新的机遇。

无论是技术研究还是产业发展都有大量的研究成果。

因此,非编码的研究无疑将为疾病的诊断和治疗提供新的诊断方向,或者为药物的设计和开发提供新的见解。

该平台为新品种、新性状的培育提供了新的基础。

组学有很多方向,精准医学才刚刚开始。

我们都是大数据专家。

我想我只能很快地谈论这个话题。

事实上,大数据分析仍然存在一些核心挑战。

第一个是数据量大。

大家知道,目前的sequencer一次普通的运行可以获取1T的数据。

这样的仪器全世界有上千台,包括我组的据说能获取1T的数据,所以数据量非常大。

那么每个人都有3×10的9次方。

这个数据告诉大家,从数据质量上来说,它是一个噪声较高、缺失值较多的数据源。

第二个样本非常小。

我们需要解决肿瘤的问题,但我们知道肿瘤的变量。

自变量可能有数万个,但我们采集的样本只有数百个,那么为什么我们需要测量,例如研究肿瘤或心脏病呢?对于脑血管疾病来说,其自身的变量有数千个量级。

我们的数量级为数百万,就像政府一样。

足以测试一百万人。

其次,我们建立适当的数学模型,利用人工智能和机器学习等方法来进行匹配。

众所周知,不仅仅是组学数据,还有生物数据,这不仅需要我们来自科技界,还需要来自企业界。

我们知道国内数据共享存在一个重要问题。

如果不解决一个数据共享问题,我们在大数据时代做小数据工作、发布小数据的公司显然无法适应国际竞争。

后面我要讲的内容就非常粗略了。

很抱歉占用了大家的时间。

谢谢你!陈润生院士发言结束后,雷锋网记者也对陈润生院士进行了简短采访: 问:目前精准医疗面临的主要挑战是什么?答:我们面临很多挑战。

精准医疗的基础是组学大数据,组学和大数据都存在挑战。

例如,在组学中,我们可以很容易地测量数据,但我们不知道数据的大部分内涵。

大数据的挖掘还有很多问题,我今天没有时间讨论,包括数据本身的生物学意义的挖掘,包括数据样本,数据集本身的缺陷比如缺失值,以及原作之间的交互等等,还存在很多问题。

但从另一方面来说,这也是一个机会。

如果我们对未知数据的研究了解一点,我们就可以前进一点,然后应用一点,从而推动整个精准医疗的发展。

问:我们开展精准医学研究的条件与国际相比如何?答:近年来,我国非常重视精准医疗,包括基础研究的投入。

事实上,从技术条件和研究上来说,并不存在根本性的困难。

困难来自于科研组织等多方面问题。

,以及基础研究如何从思想层面提高创新意识。

就发表论文而言,我们仅次于美国,但重要的是做自己的原创性研究,而不是跟随。

问:您提到“需要数百万个样本”。

我们已经知道,Deepmind和23andme等公司已经在与卫生部门和医院合作,获取数百万样本数据。

中国有类似的例子吗?答:中国有一些项目,比如精准医学研究计划,计划测量10000个数据,也在进行中。

但我认为测试哪些数据并不重要。

重要的是我们有很多数据,我们需要一个机制来整合它。

这比不断测试新数据更重要。

嘉宾简介:陈润生,生物信息学家,中国科学院院士。

现任中国科学院生物物理研究所研究员、博士生导师。

国际人类基因组组织(HUGO)成员。

在基因注释、生物进化、SNP数据分析、生物网络、非编码基因等方面进行了系统、深入的研究,参与了第一个长生栖热袍菌B4基因组序列的组装和基因鉴定。

我国的完整基因组。

参与1%人类基因组研究和水稻基因组工作草案。

近年来主要从事非编码RNA的系统发现和功能研究。

陈润生院士:人工智能和大数据如何催生精准医疗?

站长声明

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签:

相关文章

  • 首次发布 -耀视医疗获数千万元Pre-A轮融资,重点发力眼科医疗器械

    首次发布 -耀视医疗获数千万元Pre-A轮融资,重点发力眼科医疗器械

    据投资界(ID:pedaily)11月4日消息,近日,耀视(苏州)医疗科技有限公司获悉。 耀视医疗股份有限公司(以下简称:耀视医疗)完成数千万元Pre-A轮融资,投资方包括博航资本、苏高新集团旗下医疗科技一号基金。 耀明资本担任财务顾问,将继续负责后续融资。 本轮融资将用于

    06-17

  • “格陆博”完成2亿元B++轮融资,深化汽车线性控制系统发展

    “格陆博”完成2亿元B++轮融资,深化汽车线性控制系统发展

    据投资界(ID:pedaily)3月4日消息,近日格陆博科技有限公司( (以下简称“格陆博”)宣布完成2亿元B++轮融资,由百度创投、芯鼎资本、汇川万牛、湖北高新投资、紫峰资本、海涛资本、嘉基金资本联合投资,大陈创宏继续投资。 格陆博科技创始人刘兆勇博士表示,本轮融资完成

    06-17

  • 【全球财经24小时】2023年7月24日投融资事件汇总及详情

    【全球财经24小时】2023年7月24日投融资事件汇总及详情

    今日全球市场共发生23起投资披露事件,其中境内16起,境外7起。 其中,国内先进制造业9例,医疗健康行业2例,传统制造业1例,企业服务业2例,消费行业1例,消费行业1例。 旅游业。 国外医疗健康行业1例、金融行业1例、区块链行业4例、先进制造业1例。 国内事件 1、光格科技今

    06-17

  • 安瑞科技获数千万元A轮融资,由新天创投

    安瑞科技获数千万元A轮融资,由新天创投

    投资圈(ID:pedaily)领投 据12月14日消息,安瑞(上海)信息技术有限公司(以下简称“昂瑞”) “昂瑞科技”)已完成数千万元A轮融资,本轮融资由新天创投领投,产业投资人跟投,北拓资本担任财务顾问投资。 募集资金主要用于科技领域“昂瑞科技”成立于2016年,专注于建筑

    06-18

  • 谷歌自研数据中心芯片新进展:台积电明年下半年量产

    谷歌自研数据中心芯片新进展:台积电明年下半年量产

    台湾《经济日报》 2月14日,The Information援引知情人士报道称,谷歌已取得成功开发自己的服务器芯片。 按照进展,台积电预计将在下半年量产这些新芯片,并在 2020 年开始使用这些新芯片,目标是降低运营数据中心的成本,并跟上云竞争对手亚马逊的步伐。 据报道,谷歌的服务

    06-06

  • 河南设立100亿元规模信息产业发展基金,主要投向新兴信息产业领域

    河南设立100亿元规模信息产业发展基金,主要投向新兴信息产业领域

    河南省设立100亿元信息产业发展基金,主要投资新兴信息产业领域。 10月22日投资界消息,据相关媒体报道,河南省设立1000亿元信息产业发展基金,重点支持国家重大项目。 数据(河南)综合实验区引进国内外优质大数据企业,培育一批高新技术企业。   据了解,河南省信息产业发

    06-17

  • 算力、易用的产品、扎实的服务助力中小企业数字化转型 -阿里云“数智惠企-中国·江苏”行动已启动

    算力、易用的产品、扎实的服务助力中小企业数字化转型 -阿里云“数智惠企-中国·江苏”行动已启动

    随着数字化转型、智能化转型的深入,我国产业整体实力、质量效益、创新能力、竞争力、抗风险能力显着提升。 但对于全国数以万计的中小微企业来说,整体转型转型工作才刚刚开始。 如何推动中小企业科学高效数字化转型,对经济高质量发展至关重要。 作为经济大省,实体经济是江

    06-18

  • 富春环保拟以5.76亿元收购遂昌汇金80%股权

    富春环保拟以5.76亿元收购遂昌汇金80%股权

    据投资界(ID:pedaily)5月26日消息,富春环保公告称,公司拟以其旗下子公司厦门丰和、厦门丰和的股份收购厦门丰和、厦门丰和。 自有资金合计5.76亿元。 赵华棣、赵彰财、黄作恭、胡治权分别持有遂昌汇金65%、6%、3%、3%、3%的股份。 本次收购的股份总额占遂昌汇金总股本的

    06-18

  • 【创业者话题】问广西御云:云技术带来的降本增效的双重效果

    【创业者话题】问广西御云:云技术带来的降本增效的双重效果

    创想百观|主题互动——品牌AMA(AskMeAnything)赋能企业高效运营:云技术带来的降本增效协同双重效应企业上云后可以充分利用云服务提供的安全稳定的基础设施服务提供商无需投入大量资金建设数据中心,大大降低了初期投资和维护成本。 此外,云服务的高可用性和容灾机制也帮助

    06-17

  • 控股股东拟科创板IPO,原子高科暴跌或无分拆上市机会?

    控股股东拟科创板IPO,原子高科暴跌或无分拆上市机会?

    原子高科(05.OC)母公司中国通富(3.HK)计划回归A股并在科创板上市,而另一边,原子高科被投资者视为新三板“白马股”的科创科技遭遇大幅下跌,年初以来股价跌幅超过30%。

    06-17

  • 苹果的2023:新品乏味,赚钱猛

    苹果的2023:新品乏味,赚钱猛

    每年做年度回顾的时候,苹果都是绕不开的重要品牌。 尽管唱衰这家科技大公司的声音从未停止过,但苹果仍然在行业中扮演着举足轻重的角色。 无论是品牌号召力、话题热度,还是产品影响力,苹果仍处于T0级别。 科技界的大人物。 过去一年来,苹果逐步更新了部分产品,还推出了旗

    06-18

  • “基因编辑婴儿”  案宣判!贺建奎一审获刑三年,罚款 300 万

    “基因编辑婴儿” 案宣判!贺建奎一审获刑三年,罚款 300 万

    “基因编辑婴儿”案宣判!贺建奎一审被判处三年有期徒刑,并处罚金300万。 曾经震惊社会、轰动一时的“基因编辑婴儿”事件有了新的重大进展。 贺建奎被判处有期徒刑三年,并处罚金人民币1万元。 据新华社报道,12月30日,“基因编辑婴儿”一审案件在深圳市南山区人民法院公开

    06-17