首次发布 -耀视医疗获数千万元Pre-A轮融资,重点发力眼科医疗器械
06-17
11月1日,在新华网、南京市经济和信息化委员会主办的首届中国智慧谷大会人工智能与产业创新高峰论坛上,中国科学院院士、生物信息学家陈润生发表题为《 《大数据与精准医学》的讲话。
陈润生院士认为,人工智能、大数据等技术在医疗领域的应用,将推动精准医疗的发展,在疾病发生前采取针对性措施,从而改变医疗健康理念。
同时,人工智能和大数据在研究我们遗传信息中97%我们尚未了解的“暗物质信息”方面也发挥了关键作用。
总体来看,精准医疗才刚刚起步,还有很多机会。
以下为陈润生院士演讲全文。
雷锋网根据现场录音进行了编辑,不改变原意:尊敬的各位专家、各位领导,非常荣幸参加这次会议。
今天我想分享一下我对大数据和精准医疗的看法。
,因为现在大家都知道精准医疗非常流行。
虽然与人工智能相比它还是个小弟,但我们知道,2020年1月20日,奥巴马总统宣布美国将开展精准医疗研究。
自此,精准医疗受到了全世界的广泛关注。
在包括我国在内的很多发达国家,不仅是大家都关心的领域,我国领导人也多次对精准医疗的发展做出了重要指示,并在资金投入等方面做出了重要指示。
也有具体的表现。
那么今天我主要讲一下精准医疗的四个方面。
一是跟大家交流一下,希望能够展开一些讨论。
1.精准医疗是组学大数据与临床医学的结合。
第一个问题是,精准医疗的本质和核心是什么?我看到国内关于精准医疗内涵的讨论有各种各样的评论。
有不同的意见。
我个人觉得精准医疗的核心其实就一点。
很明显,这就是组学大数据和医学的结合。
更具体地说,是组学大数据与临床医学的结合。
也就是说,组学大数据应该应用于临床医学,提高医学诊断的准确性,提高治疗的有效性。
这里有两层含义,一是组学大数据,二是医学。
那么组学大数据包括两层含义,一是组学,二是大数据。
我们知道,近年来,随着临床研究的发展,我们获得了越来越多以基因组为代表的分子水平的人类信息。
,这在之前是前所未有的。
那么随着以基因组为代表的组学数据的发展,人们积累了越来越多以遗传密码为代表的信息,不仅仅是基因信息,还有蛋白质信息。
后来人们发现,挖掘这些未来我们会得到很多反映人类健康和疾病的信息。
因此,有人提出,如果将这一信息应用于临床,临床效果肯定会得到提高。
这就是所谓精准医疗的本质意义。
然而,仅仅获得有关这些遗传密码的信息是不够的。
众所周知,所有的遗传密码信息都是一个非常大量的大数据。
这些大数据很容易测量。
我们现在知道,在我们国家,每个人花一万元就可以得到你的基因信息。
密码,但是当你得到你的遗传密码时,你根本不理解它,因为它只有四个字母(A,C,G,T),所以要理解它,你必须发展大理论方法和技术数据分析 。
因此,为了在大型临床环境中使用这些组学数据,必须是组学数据和大数据分析方法的结合。
所以一部分是组学大数据,一部分是医学。
两者的结合构成了当今精准医学的本质和核心。
这是第一个问题。
关于精准医学的本质,他还表示,自20世纪90年代以来,组学数据开始应用于临床,并发展为转化医学和个性化医学。
现在,精准医学这个名字已经被创造出来了,但无论如何,它的本质是明确的,那就是组学大数据在临床医学中的应用。
2、精准医疗有可能改变医疗健康的基本理念。
第二个问题:精准医疗能给医学带来哪些本质的改变?我认为,如果精准医疗只是提高了医疗水平的一小部分,那么精准医疗不一定会引起更多领导人的关注。
就精准医疗的内涵而言,必然有一些本质的改变。
那么这些本质性的改变是什么?我们也可以用一句话来表达。
精准医疗引起各国领导人关注的本质在于,精准医疗有可能改变医疗健康的基本理念。
也就是说,可以推动医疗基本理念从目前的诊疗向健康保障转变。
我们知道现在的医疗体系是面向患者的,所以主要是给患者提供所谓的治疗。
但是,未来,由于精准医学的发展,以及组学大数据的介入,此时的健康不仅是针对患者,而是针对整个人群,针对任何人,当他没有生病的时候,我们衡量他的组学数据并分析组学大数据,然后我们可以评估他未来健康发展的危险因素。
根据评估,适当的干预将预防某些疾病的发生,减轻某些疾病的严重程度,并提高他们的生活质量。
这将推动整个医疗卫生体系向前发展,为疾病消失之前提供评估和保障。
(未来医学的三大趋势)有人认为,这种根本性的观念转变可能会导致一些新兴产业的出现。
有人预测,这种与所谓精准医疗相关的概念转变所产生的新型新技术可能会在2020年开发出来。
这一变化为2000亿美元,相当于近2万亿元人民币,这将对GDP产生影响。
这种精准医疗带来的自然观念的改变以及由此带来的产业发展,必将引起各国领导人的关注。
这是第二个方面,对精准医疗可能带来的一些本质变化的预估。
精准医学研究已成为新一轮国家科技竞争和引领国际战略的制高点。
大家都知道美国想要测量所有自然人的遗传密码,欧盟也在积极推动所谓精准医学的研究,包括英国、法国等,日本也在进行投资和计划与精准医疗相关。
那么我们该如何认真分析精准医疗,又如何能够推动行业变革和发展呢?我认为至少有四个方面:第一个可以促进海量生物样本库和数据库的发展。
众所周知,由于精准医疗的推广,需要测量数百万人的组学信息。
首先涉及从数百万人中采集、储存、提取和提供生物样本。
这当然是一个大产业。
同时,经过对这些样本的测试,数据量达到了百万人的量级,这必然会促进相应的大型数据库的发展。
有人估计,这个产业的规模可能在数百亿数量级。
其次,有了这些样本,我们需要测量基因组所代表的组学数据,所以我们需要测量基因组、蛋白质组、转录组。
仅2018年,这些测序数据就将达到1亿美元的规模。
那么有了样本库和组学数据的测量,下一步就可以基于这些海量数据的挖掘,推动大量新的分子诊断指标的产生。
我们知道将会添加很多与疾病相关的信息,其中很多信息可以用作新疾病的标记。
同时,还可以发现很多新的药物设计靶点,从而带动第三产业,也就是所谓的分子诊断和药物设计靶点的相关产业。
第四个当然是以精准医疗理念打造的新型医疗设施。
例如,将建立一些健康来源和一些健康从业人员。
这些都是可以和现在的医院、医生相关的行业,这个数量大概是1000亿。
这个行业必然会带来变化,这一点在中国已经得到体现,数百家小公司逐渐成立。
当然,他们如何才能更好地发展还有待讨论。
(精准医疗将带动基因测序、分子诊断、个性化治疗等市场规模的扩大)我国的精准医疗发展目标我就不多说了。
它们与国际上的一致。
第二个方面,精准医疗能带来什么?本质的改变,如何推动产业发展,哪些产业可以通过发展来带动或引导。
3、如何准确?我想问的第三个问题是,要实现精准医疗需要做什么?为了达到准确度,必须达到哪些点?所以我认为精准医疗至少要满足两个条件。
首先要有组学大数据的基础。
我们知道精准医疗就是将组学大数据运用到临床中,所以第一个就是获取组学大数据。
大数据就是获取基因组、蛋白质组、代谢组、代谢组等组学数据,数据本身是没有用的。
第二步是挖掘组学数据。
挖矿将使用大数据。
数据分析的理论方法包括刚才张波院士提到的人工智能方法、深度学习方法等。
基于知识的方法用于挖掘这些组学,以获得分子水平上与疾病相关的知识。
这是第一个基础。
(精准医学基础)这些分子知识、组学知识应用到临床疾病中,还必须建立第二个基础,就是在分子水平上构建以基因型为代表的信息核心。
建立了这个桥梁之后,才能够在分子水平上有效地转化信息,并将其应用到疾病的诊断和治疗中,那么这就是建立所谓的生物信息学、生物网络、系统生物学等,有了这两个基础,我们能够更好的实现精准医疗,当然,很重要的一点就是精准医疗的发展,应该和现在的临床影像、临床生化检测、现在的临床知识很好的结合起来。
这不是一些公司其他测试的顺序。
一切都已经决定了,但事实上却并非如此。
应该更好地结合起来以获得更好的准确性。
精准医学只是将新数据应用到原始数据上,以做出更好的改进。
4.精准医疗才刚刚开始。
第四章提到的精准医疗第四阶段现在处于什么阶段,发展到什么阶段了?大家都知道,也许现在精准医疗已经成为一个热词,大家都认为现在什么事情都可以做到精准,医学很容易变得精准。
从我个人的角度来看,虽然精准医疗实际上可能会带来本质的改变,但它可能会带来新的发展。
行业的发展或许规模巨大,但才刚刚开始,才刚刚开始!为什么?在精准医疗的理念下,我们仍然面临着巨大的挑战和困难。
因此,我下面举一两个例子来说明目前骨科医学存在什么样的困难?为什么精准医疗才刚刚开始起飞?我们创新的机会在哪里,挑战在哪里?我只给你举一个组学的例子。
在我们的临床代码和组学中,仍然存在很多暗信息。
所谓我们自己的遗传密码目前只是我们能够定期分析的。
目前还无法分析的一小部分就是基因组中所谓的暗信息。
我们每个人的遗传密码信息是3*10的9次方。
如果装订成一本书,一页三千字,一页装订层,就是一万本书。
如果一万本书每本长一厘米,那么我们自己的遗传密码书就有一百米长。
你可以想象你自己的遗传密码离地面有四十层楼那么高。
如果你能读懂所有内容,那么你是准确的。
我相信没有人能够准确的说出来。
我现在要告诉大家的是全世界科学家的智慧,包括生物医学科学家的智慧。
这本书中能从规则上理解的部分只有遗传密码的3%,其余的97%其实目前全世界的智慧都还看不懂。
到目前为止,我们 97% 的遗传密码都是黑暗的。

我想在下面给你一些扩展的解释。
(科学杂志《10年新世纪杰出发现》:遗传暗物质)首先,从遗传密码的角度来看,我们实际上并没有从整体和常规角度理解我们97%的遗传密码。
看法。
,我们知道的3%是大家从中学就知道的蛋白质信息。
3%是制造蛋白质的遗传密码。
我们知道它的分类和信息,但其余 97% 的遗传密码与制造蛋白质无关。
到目前为止,我们还不知道它有什么用。
这就是遗传密码中所谓的暗物质,也是遗传密码中的非编码序列。
那么这个概念,大家可以想一想,当我们测量遗传密码而97%的密码是未知的时候,我们如何才能做到准确呢?所以距离准确还有很长的路要走。
(不同生物体基因解码的程度)进入21世纪,科学家们对占人类基因组97%的我们仍不了解的暗物质遗传密码提出了质疑。
有转录产品和信息发布吗?换句话说,他是否活跃并发挥作用?这个结果是%确定的。
这些非编码序列与我们用来制造蛋白质的基因相同。
它们无时无刻不在表达,无时不在发挥作用,因此也真正完成了生物学功能。
所以这些东西我可以举几个例子来说明它和肿瘤的关系。
当然,虽然我们不能全部了解,但还是有一些零碎的例子可以说明它的生物学功能。
比如97%有这样一个产品,它叫PCGEM1,它会导致前列腺癌,而且不是由蛋白质引起的。
还有MALAT-1,可引起非小细胞肺癌。
众所周知,肺癌在我国呈快速增长趋势。
我们现在的临床医院,用来检测肿瘤的指标都是我提到的3%,治疗的目标是用的药物也是针对3%的。
现在我告诉你,97%。
有很多例子证明它们也与肿瘤有??关,但从未纳入我们的临床诊断和治疗范围。
您认为这个肿瘤可以治愈吗?好的?你没有考虑到它,当然你也没有想到去检测和治疗它。
也就是说,到目前为止,我们还有97%的与疾病状况相关的东西没有纳入我们的诊断和治疗视野中。
这就是精准医学面临的所谓组学。
暗信息的巨大挑战。
(长链非编码MALAT-1 RNA与肺癌的关系)我们知道,(遗传暗物质信息的)97%与我们的疾病和健康密切相关。
有多少这样的密码我们还没有发现?我们大约有 0 个基因。
在这97%中,我们现在可以评估一下他有多少原创吗?由于伦理原因,我们还不了解人类。
遗传学研究所对老鼠做了研究,并带来了所有原件。
不管你是编码还是非编码,总共找到了 181,000 个。
这是在老鼠身上。
实际执行功能的原件的下限实际上必须大于该值。
这里发现,产生意义的原件中的3%决定了20,000个原件。
换句话说,我们仍然有 97% 的 161,000 个(非编码 RNA),这 161,000 个。
据我所知,世界各地的科学家已经分析了大约1000个。
也就是说,还有16万个机会。
一些非常重要的组件功能有太多的机会。
发现。
这两个人属于这些领域97%的研究人员。
我曾经开过一个玩笑。
如果算一下,2018年3%的研究就造就了约50名诺贝尔奖获得者。
现在我们知道还有97%。
97比3,差不多了,所以我们在这个领域有一千多个机会做出诺奖级别的原创特殊贡献,而且只有一个名额,所以我们还有很大的机会。
(大量的非编码RNA蕴含着很多机会。
)所以,从精准医学的角度来看,我们现在其实还不能做到精准,因为有一个巨大的大数据,这只是意味着它的内涵还没有被挖掘出来。
但另一方面,它也可以为我们提供新的机遇。
无论是技术研究还是产业发展都有大量的研究成果。
因此,非编码的研究无疑将为疾病的诊断和治疗提供新的诊断方向,或者为药物的设计和开发提供新的见解。
该平台为新品种、新性状的培育提供了新的基础。
组学有很多方向,精准医学才刚刚开始。
我们都是大数据专家。
我想我只能很快地谈论这个话题。
事实上,大数据分析仍然存在一些核心挑战。
第一个是数据量大。
大家知道,目前的sequencer一次普通的运行可以获取1T的数据。
这样的仪器全世界有上千台,包括我组的据说能获取1T的数据,所以数据量非常大。
那么每个人都有3×10的9次方。
这个数据告诉大家,从数据质量上来说,它是一个噪声较高、缺失值较多的数据源。
第二个样本非常小。
我们需要解决肿瘤的问题,但我们知道肿瘤的变量。
自变量可能有数万个,但我们采集的样本只有数百个,那么为什么我们需要测量,例如研究肿瘤或心脏病呢?对于脑血管疾病来说,其自身的变量有数千个量级。
我们的数量级为数百万,就像政府一样。
足以测试一百万人。
其次,我们建立适当的数学模型,利用人工智能和机器学习等方法来进行匹配。
众所周知,不仅仅是组学数据,还有生物数据,这不仅需要我们来自科技界,还需要来自企业界。
我们知道国内数据共享存在一个重要问题。
如果不解决一个数据共享问题,我们在大数据时代做小数据工作、发布小数据的公司显然无法适应国际竞争。
后面我要讲的内容就非常粗略了。
很抱歉占用了大家的时间。
谢谢你!陈润生院士发言结束后,雷锋网记者也对陈润生院士进行了简短采访: 问:目前精准医疗面临的主要挑战是什么?答:我们面临很多挑战。
精准医疗的基础是组学大数据,组学和大数据都存在挑战。
例如,在组学中,我们可以很容易地测量数据,但我们不知道数据的大部分内涵。
大数据的挖掘还有很多问题,我今天没有时间讨论,包括数据本身的生物学意义的挖掘,包括数据样本,数据集本身的缺陷比如缺失值,以及原作之间的交互等等,还存在很多问题。
但从另一方面来说,这也是一个机会。
如果我们对未知数据的研究了解一点,我们就可以前进一点,然后应用一点,从而推动整个精准医疗的发展。
问:我们开展精准医学研究的条件与国际相比如何?答:近年来,我国非常重视精准医疗,包括基础研究的投入。
事实上,从技术条件和研究上来说,并不存在根本性的困难。
困难来自于科研组织等多方面问题。
,以及基础研究如何从思想层面提高创新意识。
就发表论文而言,我们仅次于美国,但重要的是做自己的原创性研究,而不是跟随。
问:您提到“需要数百万个样本”。
我们已经知道,Deepmind和23andme等公司已经在与卫生部门和医院合作,获取数百万样本数据。
中国有类似的例子吗?答:中国有一些项目,比如精准医学研究计划,计划测量10000个数据,也在进行中。
但我认为测试哪些数据并不重要。
重要的是我们有很多数据,我们需要一个机制来整合它。
这比不断测试新数据更重要。
嘉宾简介:陈润生,生物信息学家,中国科学院院士。
现任中国科学院生物物理研究所研究员、博士生导师。
国际人类基因组组织(HUGO)成员。
在基因注释、生物进化、SNP数据分析、生物网络、非编码基因等方面进行了系统、深入的研究,参与了第一个长生栖热袍菌B4基因组序列的组装和基因鉴定。
我国的完整基因组。
参与1%人类基因组研究和水稻基因组工作草案。
近年来主要从事非编码RNA的系统发现和功能研究。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-06
06-18
06-18
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态