智能财税服务品牌“慧算账”获6000万美元C+轮融资
06-17
1。
弹性的基本概念 Gartner从两个维度定义了云服务的弹性:从云服务器提供商的角度来看,云服务的弹性是指“云服务具有根据需要自动增加或减少的系统容量能力(如CPU、内存、磁盘和网络带宽)将给用户带来无限计算能力的感觉。
”从客户的角度来看,云服务的弹性是指云服务能够根据需求的波动自动增加或减少特定服务的容量。

弹性能力主要解决特定业务场景下资源和业务负载波动的匹配能力。
当然,弹性还有更广泛的描述,即云资源支持按需访问,需要时可以快速获取,不需要时可以随时释放资源。
这种能力现在已经成为公有云的标准能力。
本文不再做进一步的相关阐述。
弹性是指平台根据业务负载的变化,及时、自主地增加或减少基础设施资源的能力。
其中,资源可以是CPU核数、内存、网络带宽、磁盘、ECS实例等。
弹性是公有云的典型优势之一。
根据增加或减少资源的粒度,弹性可细分为以下两类: 纵向弹性:主要指计算资源的某一组成部分的增加或减少,如CPU核数、内存大小、网络带宽等、磁盘空间等。
水平弹性:主要指增加或减少相同计算资源的数量。
与弹性相关的一个概念是可扩展性,通常是指系统在不中断服务的情况下增加当前硬件资源(向上扩展)或添加额外的硬件资源(水平扩展)的能力。
应对更高业务负载的能力。
与弹性能力总是试图提供与当前业务负载相匹配的动态能力不同,可伸缩性是一种静态属性,通过提供更多的资源来增量地满足负载增加的场景。
当业务负载降低时,弹性会动态释放不需要的资源,而可伸缩性则不会。
因此,可扩展性只能满足部分弹性场景的需求,可以视为弹性能力的子集。
2.弹性能力的商业价值。
对于存在周期性峰谷波动,或者偶尔出现临时流量激增的业务,如何快速应对,避免流量高峰期业务不可用?客户端常见的要求如下: 资源交付速度:指的是获取资源的周期,包括从发起资源请求到资源交付的周期。
资源数量保证:指获取所需资源的成功率。
成功率也会影响生意是否受损。
例如,单个资源扩容需要台湾算力,但由于资源不足,只能交付台湾算力。
当突然出现流量高峰时,留给资源响应的时间通常不会太长。
如果资源不能快速交付,将直接影响业务的正常访问。
弹性成功率:公有云资源巨大,可以考虑为单个用户提供无限的算力。
但不同云厂商在不同地区的资源池规模不同。
当可用区的资源规模有限时,用户可能会遇到因资源不足而无法满足弹性算力的情况。
弹性成功率将直接影响业务的连续性和可用性。
弹性效率:对于需要大规模算力的场景,比如渲染或者科学计算,如果用户批量申请所需的算力,只有当算力全部准备好后才能启动任务,这必然导致一些应用程序但未使用的资源被浪费,因此一次性交付大规模计算能力的效率将大大提高业务的效率。
弹性精度:对于自动响应业务负载波动的弹性场景,如果请求的资源需求大于当前业务负载需求,就会出现供给过剩,造成资源和成本的浪费,而如果资源需求较小超过当前业务负载需求,就会出现业务服务降级甚至不可用的场景。
因此,提供与业务负载匹配的精准资源量,可以更好地实现业务与成本的平衡。
灵活的资源预留:对于非常规的灵活需求,例如双十一等年度促销或新游戏发布等,客户在无法保证弹性成功率的情况下,需要额外的灵活资源保障机制来应对突发事件。
商业流量。
2)弹性能力分级 云上的弹性能力与资源的使用和成本密不可分。
综合衡量业务的弹性成熟度,需要从业务弹性管理能力和资源成本管理两个维度进行。
因此,我们将弹性成熟度分为以下五个级别,对应的能力要求如下: 如果您想评估您企业的弹性能力成熟度,建议前往第10章“CloudOps成熟度自评估”。
4. 提高弹性能力的建议和步骤为了充分利用云上的弹性能力来提高业务可用性,用户可以按照以下步骤分析云上的业务形态和架构,并进行相关的业务改造,以提高高可用性的业务。
降低成本: a) 分析识别业务中负载波动的业务模块。
b) 明确不同业务模块对应的负载波动上限和下限,决定了该模块在业务高峰期和低谷期所需的资源数量。
c) 分析负载波动所需资源的数量和对应的时间分布,确定是否可以通过自动扩缩容来满足所需资源,或者是否需要提前准备。
例如,类似双11促销的活动,流量会增加数百倍。
需要提前准备好相关资源。
d) 明确应用层不同业务模块的需求或约束,如系统初始化要求、会话维护、资源释放时的数据处理要求等。
e) 分析目前不具备弹性能力的业务模块是否可以通过类似弹性伸缩的产品进行改造,提高业务可用性。
f) 根据历史业务波动规律配置相关扩缩容策略,并测试是否满足业务负载变化的需要。
g) 继续测试和改进弹性伸缩相关配置,直至匹配业务波动。
5、弹性工具推荐 1)开源弹性工具推荐。
目前,还没有主流或广泛使用的开源工具用于虚拟机(Virtual Machine)维度的水平扩展和收缩。
然而容器(Container)维度的水平伸缩是基于Kubernetes的。
调度层弹性组件应用最为广泛。
Kubernetes 的调度层资源主要分为两个维度: 节点级:由多台服务器组成的集群资源池。
Pod级别:是Kubernetes中最小的部署单元,代表一个正在运行的应用程序。
Kubernetes调度层的弹性主要是根据业务负载的变化自动调整应用的副本数量或者资源的大小,从而实现调度层的伸缩。
Kubernetes弹性组件分为两类:水平扩展(HPA)组件和垂直扩展(VPA)组件。
容器资源水平扩展(HPA) Kubernetes 使用 Horizo??ntalPodAutoscaler 组件根据资源使用情况或自定义指标自动增加或减少 pod 副本。
其工作原理如下: 容器资源垂直扩展(VPA) Kubernetes 使用 VerticalPodAutoscaler(VPA)组件,根据容器资源使用情况自动设置 CPU 和内存调整请求,从而实现对 Pod 的资源调整。
VPA会根据Pod资源的使用情况,自动为集群设置资源占用限制,让集群将Pod调度到资源充足的最佳节点上。
其工作原理如下: 2)阿里云的弹性工具推荐阿里云提供了丰富的VM粒度的弹性产品和工具。
用户可以通过控制台或标准OpenAPI快速完成业务接入和集成,提高云服务的可用性和连续性,同时降低云成本。
a) 纵向扩展 对于单体应用、独立应用、有状态应用等场景,随着业务的不断升级和变化,用户需要快速升级资源配置以应对业务变化。
例如,一些视频平台的营业高峰时间是晚上6点到12点,他们对计算能力和网络资源的需求会比以前更大。
这时客户需要升级系统配置,比如升级到更高性能的实例规格、增加带宽配置、扩大磁盘大小等。
当高峰期结束时,整体负荷下降到低状态。
出于成本考虑,企业可以对云服务器配置进行降级,比如降低实例规格、降低带宽值等。
阿里云的云资源均提供控制台和标准OpenAPI,用户可以根据需要自行完成云资源的配置变更。
目前阿里云提供的VM维度纵向扩展能力包括:修改CPU核数、内存大小、磁盘大小、公网带宽大小、修改带宽付费方式等。
用户还可以使用运维编排服务( OOS)在指定时间或触发某种条件时自动调整虚拟机规格,以满足各种场景的需求。
b) 灵活供给 对于科学计算、图形图像渲染等场景,通常对算力交付的需求较高,包括单个任务所需的算力规模较大(可能需要数千、数万核)算力))、尽量一次性满足海量算力(否则任务无法正常执行)、希望算力成本尽可能低等等。
因此,快速交付海量算力的能力也体现了云厂商的弹性和深入的经验。
公有云的按需付费模式催生了一种新的付费形式,称为抢占式(Spot)实例或竞价实例。
Spot实例的本质就是以较低的价格(通常是按量付费价格的10%~90%)出售公有云中的闲置资源,吸引对价格敏感的用户竞价购买,价格越高的实例价格越高。
投标人得到它。
Spot实例虽然价格便宜,但由于采用竞价模式,价格会随着闲置资源的使用情况而波动。
这意味着一旦Spot实例的市场价格超过用户的出价或者系统有库存或其他需求,该实例将被平台自动使用。
回收后,实例上运行的业务将停止,因此用户的应用程序需要适应这种行为。
对于一些对价格非常敏感但容错能力较高的业务,如果能够充分利用Spot实例的特性,可以以较低的成本快速交付业务。
阿里云弹性供给组是快速交付ECS算力集群的解决方案。
用户只需指定所需算力的大小和单位(支持vCPU核数、ECS实例数、内存数等),以及可用区和实例规格、弹性供给组会自动扫描指定可用区指定实例规格的算力,最终交付指定规模的算力。
除了提供算力外,弹性供给组还可以在以下维度进一步满足个性化的弹性需求场景: 精细化的成本控制:对于价格敏感的用户,弹性供给组在支持指定算力集群的卷型实例和 Spot 实例的基础上在保证基础算力的基础上,通过现货实例降低算力集群的总拥有成本。
弹性供给组还支持指定实例规格的最高出价和成本优化的交付模式。
这样系统会自动选择指定可用区的实例规格中价格最低的实例进行交付,进一步降低算力使用成本。
自动维护计算能力:如果使用竞价型实例,当竞价型实例被回收时,计算集群的总容量将会减少。
通过弹性供给组的保留模式,当现货实例被回收或者总算力不满足时,弹性供给组会自动寻找算力进行补充,完全无需人工??干预。
c) 弹性伸缩(ESS) 对于分布式应用、无状态应用、大规模应用等场景,用户手动指定固定数量的云资源,已经无法满足业务快速剧烈的变化。
客户可以使用阿里云的弹性伸缩服务(ESS)根据业务需求和政策自动调整实例数量。
当业务需求增加时,弹性伸缩自动添加实例,保证算力;当业务需求减少时,弹性伸缩自动减少实例,节省成本。
同时,弹性伸缩具有检查实例健康状况的能力,可以自动识别并替换不健康的实例。
不仅适合业务量波动的应用,也适合业务量稳定的应用,保证业务的持续运行。
目前,弹性伸缩(ESS)产品提供以下维度的自动化能力,帮助客户自行实现业务自动智能扩缩容,快速提升业务可用性。
灵活丰富的扩缩容模式,适合业务负载波动比较稳定的场景,比如每天中午12点开始业务需求大幅增加,晚上8点以后业务需求大幅减少的场景。
每天。
用户可以通过计划任务快速完成预期负载。
回复。
但对于业务负载变化无明显规律的场景,或者在规律波动之外偶尔出现负载突然变化的场景,需要更灵活的伸缩模式来应对业务波动。
弹性伸缩目前提供的扩缩容模式包括: 手动模式:允许用户手动进行弹性伸缩,包括手动添加、移除或删除现有资源。
固定数量模式:用户设定集群期望的最小/最大资源数量。
当实例数量低于下限/超过上限时,系统会自动添加/删除资源,使资源数量等于下限/上限。
健康监控模式:系统自动检查计算资源的运行情况和健康状况。
如果发现某个计算资源没有运行或处于不健康状态,弹性伸缩服务会自动移除该资源并创建新的资源来替换它。
定时模式:用户可以创建定时任务,在指定时间内自动创建或释放指定数量的资源。
指标模式:监控集群内资源的性能指标(如CPU利用率、网络流量平均值)的波动情况。
当该指标当前值超过指定阈值时,自动触发执行资源的扩缩容。
完整的业务指标监控矩阵。
一般来说,业务负载的波动与一项或多项业务指标强相关。
即用户可以通过监控业务负载的一项或多项指标来识别业务的上下波动。
阿里云的弹性伸缩服务不仅支持根据伸缩组内集群实例的CPU占用率、内存占用率、网络吞吐量等十多项性能指标进行扩容和缩容,还支持基于实例的自动伸缩其他产品的指标。
扩缩容,比如负载均衡QPS。
弹性自愈能力:弹性伸缩自带健康检查能力,定期扫描伸缩组内ECS实例的健康状况。
如果发现实例关闭(无法提供正常服务)或者实例操作系统出现异常导致实例无法正常响应,弹性伸缩服务会自动移除该实例并创建一个新的实例来替代,以保证实例的正常运行。
业务需要计算能力。
另外,当伸缩组关联负载均衡器时,如果负载均衡器检测到伸缩组中某个实例出现异常,会自动移除该实例,Auto Scaling会自动创建新的实例,保证算力稳定。
有效的成本控制弹性伸缩目前提供两种方法帮助用户在保证业务可用性的同时尽可能降低算力成本。
首先,弹性伸缩支持在扩容时同时选择按量付费实例和抢占式实例,并指定两种实例的比例。
其次,弹性伸缩的动态伸缩模式和预测伸缩模式都可以根据业务负载波动自动计算所需算力的调整,实现资源规模与负载需求的直接完美匹配,避免因业务负载过高而造成的成本浪费。
-供应。
个性化的弹性管理能力,适合一些无法完全无状态的业务负载。
例如,扩容时,需要下载最新的数据或代码,新交付的实例才能正式接管负载。
弹性伸缩生命周期钩子可以实现扩容和缩容。
个性化配置。
目前,弹性伸缩支持两种类型的生命周期钩子:扩展和收缩。
用户可以在扩容过程中创建生命周期钩子,并在新扩容的实例正式使用之前在实例内执行一些自动化配置任务,例如安装某些应用程序或执行某些脚本。
当任务完成后,实例才真正投入使用。
伸缩的生命周期钩子也是类似的场景。
满足多样化的弹性需求。
对于自动化能力较高的用户来说,希望能够监控弹性伸缩的各种行为和结果,并与其他系统进行通信。
例如,当扩张失败时,他们需要及时感知。
并自动执行其他任务以避免业务受损,并且可以消费弹性伸缩提供的各种事件和通知通道。
目前弹性伸缩支持扩容成功、扩容失败等场景的事件,并支持MNS消息队列、云监控等订阅通道,方便用户快速完成接入和连接。
超高弹力成功率。
云上计算资源的获取由实例的具体规格指定。
例如阿里云的c5.large、c6.large、c7.large等实例规格可以提供2核、4GB的算力。
。
如果客户的业务负载对算力没有特殊要求,比如实例的网络吞吐量上限等,在使用弹性伸缩时,可以选择满足要求的多个可用区和多个实例规格。
当遇到临时突发流量时,弹性伸缩服务会自动检查多个可用区中所有符合要求的实例,尽可能提供所需的算力,避免因单一资源库存不足而导致业务降级或损坏。
智能弹性 针对周期性明显的负载波动,弹性伸缩服务提供预测伸缩模式,对历史业务负载波动进行分析和建模,自动预测未来两天业务负载的变化。
无需用户配置即可按需实现。
随时自动扩缩容所需的算力。
目前,弹性伸缩的预测伸缩模式仅适用于CPU、内存、网络带宽周期性波动明显的业务负载。
d) 灵活的资源预留 对于双11促销、新游戏服务器上线等可能出现意外流量高峰的场景,传统的弹性无法满足需求。
为确保特殊阶段提供某些服务,顾客需要提前预约。
除了预计的资源外,还需要额外的资源储备来应对计划外的交通请求。
传统模式下,这些临时追加资源的储备面临两大问题:采购周期长、数量难以估算。
不准确的估算可能会因资源不足而造成业务损失,也可能因资源过多而造成成本浪费。
由于需求暂时突然增加,使用周期短,后期会面临闲置问题。
阿里云提供的资源预留服务,既可以满足使用时间可变的峰谷弹性需求,也可以满足资源使用稳定、弹性规模高的周期性弹性需求。
资源预留服务中的弹性保障可以为日常弹性资源需求提供弹性资源的确定性保障,且支付方式灵活。
用户只需支付较低的保证费,阿里云就会以私池的形式为用户预留相应的资源池。
用户可以在固定期限内(支持1个月至5年)获得特定容量,灵活的资源保证交付所需算力的%。
资源预留服务中的容量预留可以锁定指定的容量资源,快速满足弹性规模大的场景。
对于可能面临流量突然增加的场景,用户可以通过容量预留提前锁定部分资源,在需要时优先从锁定的资源中获取算力,避免因资源不足而无法满足需求突然增加的情况资源。
参考资料:《云原生白皮书:白皮书2.0》系列文章一:前言:提出CloudOps成熟度模型CARES《CloudOps云上自动化运维 白皮书2.0》系列文章二:CloudOps的主要衡量维度和定义《CloudOps云上自动化运维 白皮书2.0》系列文章三:CloudOps成熟度模型CARES《CloudOps云上自动化运维 白皮书2.0》总体 CloudOps 成熟度模型及其级别 描述《CloudOps云上自动化运维 白皮书2.0》系列文章四:自动化能力自动化《CloudOps云上自动化运维 白皮书2.0》系列文章六:可靠性能力可靠性《CloudOps云上自动化运维 白皮书2.0》系列文章七:安全性和合规性能力安全性《CloudOps云上自动化运维 白皮书2.0》系列文章八:成本和成本资源量化管理能力成本《CloudOps云上自动化运维 白皮书2.0》系列文章九:CloudOps成熟度模型全景《CloudOps云上自动化运维 白皮书2.0》系列文章十:CloudOps成熟度自我评估亲爱的行业专家和引领浪潮的企业家,阿里云正在进行“客户云支出”调查趋势》并已完成10份填写问卷(只需2至3分钟,每家公司只能填写一次),就有机会赢取小礼物!问卷请见链接:#阿里云#创业者计划#中小企业服务#创新创业 9月21日,阿里云正式启动阿里云创业者计划,联合知名投资机构、加速器、创意服务机构和创新创业者大企业的力量。
旨在为初创企业提供全方位的赋能和服务,帮助其在阿里云上快速建立自己的业务,开启智能时代的创业新范式。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-06
06-17
06-17
最新文章
3月,腾讯《王者荣耀》在全球App Store和Google Play吸引了2.57亿美元,同比增长63%
生鲜传奇宣布完成数亿元B+轮融资
裁员20%?红杉中国回应:胡说,员工总数不降反升
第二次影视创新“闯”短剧世界:看、留、跳都是钱
ASML:从飞利浦弃儿到光刻之王
宁康瑞珠获数千万元A轮融资 横琴金投、翰颐资本投资
智能金融服务生态平台科客完成A+轮融资
拼多多九鼎:信息披露无懈可击,竞争对手才是“浇水”的