天风天瑞两只基金已完成募资设立,总规模达2.5亿元,
06-18
年了。
英国生物化学家弗雷德里克·桑格和美国生物化学家Walter·吉尔伯特建立了DNA测序技术并赢得了诺贝尔化学奖的青睐。
在接下来的40年里,测序技术经历了多次革命。
北京大学的谢晓亮·教授曾表示,2006年发生的下一代DNA测序仪的革命导致测序价格下降的速度超过了半导体行业指数下降的速度。
“只需美元,一天内即可完成个人基因组测序,为疾病治疗和预防的个性化解决方案提供参考。
” 2009年,首次推出单细胞测序技术。
四年后,单细胞测序技术被《自然方法》杂志评为年度技术。
2016年,单细胞测序技术再次登上《科学转化医学》封面。
目前,全球单细胞测序潜在科研市场规模已达1亿美元。
单细胞测序有什么好处?简而言之,世界上没有两片相同的叶子。
对于多细胞生物来说,细胞之间存在差异。
传统的研究方法是在多细胞水平上进行的。
因此,最终的信号值实际上是多个细胞的平均值,异质性信息丢失了。
这就像合唱一样,相比一般的,有些浑水摸鱼的人不会被注意到。
2001年以来,单细胞基因测序技术发展迅速。
基因测序作为一种高效的医疗辅助手段,为出生缺陷的预防、遗传病的检测、肿瘤的治疗等方面提供了有效的帮助。
然而,这项被寄予厚望的技术如今却碰壁了。
为了突破“记忆墙”,Geneseeker所做的就是单细胞基因测序。
这家初创公司成立于2016年,进驻北大医药产业园,于2019年1月获得B轮融资,并于去年开始商业销售。
短短一年时间,与多家客户建立了科研合作关系,同时在上海、广州、成都建立了当地实验室。
信银生物信息部张广新表示,“单细胞检测技术没有太多客户偏好,只要是单细胞层面有需求的,比如药企、科研院所等,都是我们的客户。
” ”然而,更多的客户也会带来更多的挑战。
就像早年的双11一样,高并发导致淘宝app崩溃。
数千万人同时参观,消费者未必能抢到限时折扣。
因此,寻因生物学也面临这样的问题:极大的数据量和分析复杂度会导致任务并发性低、数据加载速度慢。
张广新举了一个例子。
单细胞测序文件的大小可达GB以上。
随着单细胞项目包含的样本越来越多,细胞数据量往往达到数百GB甚至TB。
其次,单细胞数据分析复杂,需要反复读取数据和调整参数。
因此,处理海量细胞样本的分析任务通常需要数小时甚至数天才能完成。
当样本数量增加时,每个样本之间必须进行各种相关或更复杂的计算,因此计算能力的消耗会非常大。
现在,很多多组学测试正在逐渐发展起来,在普通单细胞的维度上增加了很多维度,对计算能力的需求将达到更高的水平。
如果这就是生化分析行业的本质,那么计算机系统架构本身的“阿喀琉斯之踵”就是问题的关键。
生物信息行业缺乏覆盖全流程的开源软件。
通常一个生物计算项目需要多个软件的配合。
因此,第一步的输出往往是第二步的输入,中间有大量的I/O(输入/输出)过程。
张广新表示:“毫不夸张地说,我们12天中有10天都在I/O。
而且,随着单细胞检测的成本逐渐降低,应用越来越广,生物信息学数据将会越来越丰富。
”因此,生物信息学分析通常的操作是降低样本参数,或者只运行比较大的单细胞分析任务,但当测序任务较多时,可以进行多个单细胞分析项目。
在张广新看来,无论时间周期和算力投入,都能满足客户的需求,但考虑到单细胞的检测分析在科研和药物领域会越来越普及。
随着生物信息技术的发展,需要分析的数据和维度越来越多,生物信息行业不得不寻求更加优化的计算架构。
他的关注点不仅仅在生物技术领域,在AI行业也是如此。
此前,有AI行业人士向雷锋网坦言,“未来AI训练的瓶颈不是算力,而是GPU显存”。
做个简单的比较:2018年GPT-2所需的内存容量已经是AlexNet的7倍多了。
随着机器学习、计算机视觉和自然语言处理等人工智能应用的兴起,处理器需要更频繁地访问内存和传输数据。
传统的冯·诺依曼计算机架构依靠总线在内存和处理器之间进行数据传输。
面对此类数据密集型应用时,往往很难平衡低延迟和高能效。
这种数据传输瓶颈现象通常被描述为“内存墙”和“电源墙”。
以求因生物为代表的单细胞领域,就像武术大师需要更好的杠杆点来施展轻功。
问题在三年前出现了逆转。
2019年,迅银生物与阿里云合作。
前者是阿里云ecs.g5、g6、g7三代产品的用户。
阿里云弹性计算产品总监王志坤告诉雷锋网(公众号:雷锋网),“企业客户最关心的从来不是谁最快、谁拥有最极致的产品。
他们关心的是性能和成本。
、可靠性之间的平衡。
”在王志坤看来,判断一个企业是否适合使用“大内存云”有两个标准:一是企业的数据量是否足够大。
由于数据量较大,IO是否是主要瓶颈;第二,具体任务的计算量是否较大。
计算量大,运行起来是否耗时?同样,客户在选择大内存云之前,首先要建立CPU、内存和IO的预测模型。
但在企业做出预测之前,类似的行业解决方案已经在阿里云平台上覆盖,并经过其他客户的POC验证,使得企业解决方案互通、行业共建成为可能。
王志坤表示,这种能力是阿里云作为云厂商的独特基因。
“我们更擅长的是互联网平台的方式,整合海量业务场景,加速整个行业的研发效率。
”谈及上云的原因,张广新表示,“利用阿里云将公司本地自建机房改造成计算池,不仅可以保证整体算力,而且还有多种付费模式,这样就可以其次,阿里云深耕生物信息行业多年,已经形成了多种服务解决方案和客户资源,可以为上下游的互联互通提供更多支持。
生物科技公司,这是很多生物科技公司所看重的。
“就是多代产品的使用,”张广新说,计算速度快,数据加载和导出成本低。
鑫根生物单细胞基因测序性能从秒级降低到2.5秒;单任务样本量提升一倍,运行时间与单任务几乎相同时,并发测序数量。
任务数量从1个增加到5个,任务处理效率提升了5倍之多。
从目前的结果来看,寻因生物找到了对的人。
共同打造的“大内存云”时代,任何改变都源于最直接的需求。
医疗健康行业因其技术要求高、数字化水平低,成为数字化最重要的应用场景之一。
从药企药品数字化全流程追溯,到医院医疗信息化改革,包括三级医院电子病历全覆盖,都体现了真实的行业痛点。
因此,讯银生物等下游客户对“内存”的需求,正逐渐迫使其之上的芯片厂商、ISV(独立软件开发商)以及云服务商不断拿出新的解决方案。
路。
各方之所以在突破“记忆墙”上思想如此一致,是因为他们决心追求计算机基础设施的“革命”。
事实上,源自云主机时代的产品,从某种意义上来说,就是对传统CPU和内存堆栈不满的爆发。
数据分析底层技术的需求是一个漫长的历史演变过程。
虽然近年来不少企业已经迁移到云端,但过去的云主机却始终能够弥补不足。
例如,过去所有的云主机产品,比如2路服务器,大多采用X86架构。
不过Intel每一代产品的内存插槽数量都是固定的,单条内存的容量也是固定的。
如果计算能力和存储问题仍然出现,解决方案是继续Scale up(垂直扩展),将2路服务器升级为4路甚至8路。
但多个CPU和内存之间的缓存一致性、主板的复杂度等也会急剧上升。
因此,各行业的客户要么选择非常昂贵的大内存产品,要么选择由小内存组成的集群产品。
王志坤也坦言:“阿里云很早就推出了超大内存实例,但当时的成本确实很高。
”长此以往,计算机基础设施可以说是四个字:一往无前。
直到2018年英特尔推出采用新介质的第二代英特尔傲腾持久内存系列,业内人士一度被迫寻求变革。
英特尔相关负责人表示,2019年,随着Optane SSD(Optane Solid State Drive)的推出,我们知道这是一个真正的游戏规则改变者,距离带有DIMM接口的Optane持久内存的诞生已经不远了。
但当时之所以能够给大众这样的愿景,是因为这款产品兑现了两年前的承诺,正式推出了基于3D XPoint介质的SSD产品。
2016年,英特尔基于3D Xpoint存储介质打造了Optane技术,一举改变了传统内存和存储层次结构。
通过缩小冷热数据之间的差距、减少IO瓶颈并解决数据延迟,让内存更接近计算,为数据中心提供更大的灵活性和更多价值。
Optane SSD的问世无疑证明了新介质已经诞生,而且极有可能是一款过渡性产品,将掀起内存产品的革命。
后续的故事继续描绘新的剧本。
2018年4月,Intel正式发布Optane内存DIMM版本; 2017年,英特尔发布Optane持久内存系列,成功完成大规模商业化; 2018年,英特尔发布了第三代英特尔至强可扩展处理器(代号:Ice Lake)和英特尔傲腾持久内存系列,生态系统变得更加强大。
英特尔? 傲腾? 持久内存支持分层架构,可实现高性能、大内存计算。
2017年,阿里云基于第三代英特尔至强可扩展处理器和第二代英特尔傲腾持久内存系列开发了基于性能的产品线。
不同规格的更强大实例:re7p、r7p和i4p,使用场景更广泛。
尤其是i4p,可以提供极高性能的本地磁盘。
相比传统NVMe SSD数十至二十微秒的延迟水平,其延迟可缩短至纳秒。
非常适合重IO应用,可以帮助此类应用突破性能瓶颈。
从目前的合作形式来看,信义生物的单细胞测序分析任务部署在阿里巴巴第三代英特尔至强可扩展处理器(代号:Ice Lake)和第二代英特尔傲腾持久内存上。
在云 i4p 持久内存实例上。
讯银生物的张广新表示,“好的大内存云,是用了之后感觉不到它的存在,我只是专心做好我的事。
”大内存云架构 其次,阿里云找到了合作伙伴MemVerge。
MemVerge 是做什么的?简单来说,它推出的Memory Machine就是内存虚拟化软件,相当于存储的“操作系统”。
MemVerge? 的 Memory Machine? 软件是业界首款虚拟化内存硬件的软件,可实现容量、性能、可用??性和移动性的精细资源分配。
Memory Machine 建立在透明内存服务的基础上,还提供了另一项业界领先的技术 - ZeroIO? 内存快照,它可以在几秒钟内封装 TB 级的应用程序状态,并以内存速度实现数据管理。
MemVerge CEO范成功告诉雷锋网,“今年3月,英特尔推出了Optane SSD,从某种程度上来说,这是一种新的内存存储架构。
要实现‘大内存’架构,除了硬件之外,还需要有相应的软件来生产,这就是我们成立的初衷。
”他认为,每次使用新的硬件,都必须开发新的软件堆栈,以使应用程序能够充分利用新的硬件。
通过阿里云的计算巢模式(即云厂商向企业应用服务商及其客户开放的服务管理PaaS平台),阿里云让后者的Memory Machine大内存虚拟化软件与云平台标准化集成,加速软件交付部署并规范运维管理,大幅提升业务效率。
范成功告诉雷锋网,“基础IT行业将逐渐认识到‘大内存’技术对于生产力和计算速度的重要性。
同时,通过内存快照和应用胶囊技术,我们可以将求因有机体从经历过太多的阿里云也对MemVerge的作用给出了肯定的答案,王志坤坦言,阿里云不太可能打造服务行业客户需要的ISV。
像MemVerge这样的独立软件开发商)进来了。
“行业仍然存在缺口,这个缺口需要像MemVerge这样的创新技术服务提供商来填补。
通过技术创新,他们可以很好地利用基于阿里云和英特尔傲腾持久内存的能力,同时也满足垂直行业、垂直扩展领域的大内存场景的需求。
“最后是和阿里云内部生态系统相连。
纵观阿里云的架构,除了自主研发的“龙”云服务器架构外,还有“飞天”云操作系统、“盘古”存储平台、“洛神”网络平台、POLARDB云原生数据库等。
,构成了统一的云平台,赋予了阿里云从虚拟化层到操作系统内核层的全链路集成和调优能力。
这些能力最终使得阿里云弹性计算团队在持久内存的产品开发上变得更加敏捷。
对于基础IT市场的演进趋势,范成功坦言,“市场还处于早期阶段。
但未来2-3年,特别是随着Intel CXL(Compute Express Link)的完善,生态系统将变得更加完整。
”对于未来,范成功也充满期待,“阿里云是中国云计算领域的领军者,所以未来我们会继续与阿里云、英特尔合作,一方面,共同培育“大内存”市场的客户,包括生物信息学、EDA模拟、金融等行业;另一方面,我们也会在技术上有更多的融合和合作,让联合解决方案有更好的用户体验”成为关键。
“东方数字、西方计算”战略的一部分是21世纪的生活。
科学世纪。
无论是从经济成本还是业务发展的角度考虑,越来越多的厂商开始向云端迁移,将数据处理部分留给专业厂商。
2020年7月新一轮疫情期间,湖南省将流量调整任务交给长沙超算中心,利用强大的HPC将时间缩短至1.4秒。
但如果用户有大数据相关业务,部署到传统超算中心会非常困难,因为数据移动费时费力。
这也是E-HPC的初衷。
早在2018年,阿里云就在公有云上发布了国内首个弹性高性能计算平台E-HPC。
当时,“云超算中心”一亮相就引起了公众的关注。
它可以一键部署弹性扩展的高性能计算集群环境,帮助科研机构和企业处理大规模科学计算问题。
张广新表示,针对生物行业,阿里云可以提供一些资源调度解决方案。
例如,E-HPC解决方案可以帮助我们简化编写过程、监控任务交付、任务计算过程。

他谈到了新勤生物未来使用阿里云的一些计划:从快速计算的角度,使用更灵活的东西。
例如,业务量到来后,可以快速产生很多节点来并发计算。
信银生物还需要对集群或者阿里云平台进行一些精细化管理。
因此,在E-HPC层面,对寻因生物的需求还是比较充足的。
从省钱的角度来说,阿里云的服务有不同的定价,必须考虑数据存储的性能和周期再进行细节调整。
后续,讯银将基于阿里云开发单细胞分析平台,直接向用户提供服务,让科研用户和药物研发用户具备分析单细胞数据的能力。
从更大的社会背景来看,数据和算力成为新一轮的新焦点,这也给云计算厂商带来了更多时代命题。
继“南水北调”、“西电东送”、“西气东输”等工程后,今年2月,“东电西算”工程启动。
其本质是将数据中心、云计算和大数据融合在一起,形成一种新型的算力网络系统。
国家发展改革委等部门联合发布通知,同意在京津冀、长三角、粤港澳大湾区、成都等8地启动国家算力枢纽节点建设重庆、内蒙古、贵州、甘肃、宁夏,并根据枢纽规划建设10个国家级数据中心集群。
王志坤告诉雷锋网,“阿里云早期的机房建设是租赁的形式。
从六年前开始,阿里云就开始计划建设自己的大型基地式数据中心,与几大算力合作。
“东西部枢纽的方向是一致的。
”其中,阿里云服务京津冀地区的张北数据中心已于今年9月投入运营,大力利用风电、光伏等绿色能源。
宣化数据中心也在建设中;内蒙古枢纽乌兹别克斯坦兰察布超级数据中心今年6月开始提供云计算服务;在成渝枢纽,阿里云西部云计算中心和数据服务基地于今年11月落户成都。
更重要的是,从东算到西的国家战略工程与云模式非常契合。
由于云计算模式是基于客户需求的,计算和存储更加灵活和安全。
这与东西方数据中心的跨区域数据调度计算、适度聚合、集约化发展有着本质上的一致性。
王志坤表示,“无论是我们的底层能力,还是我们的云资源调度能力,我们有信心成为国家战略的重要组成部分。
”阅读原文。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-18
06-18
06-18
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态