云计算、大数据、人工智能等新技术正迅速的改变着我们所处的时代,其巨大的影响力已经从量变到质变,数字化转型成为企业发展的必然选择。 据IDC报告,全球前1000的大企业中,67%的企业已将数字化转型变成企业级战略,企业数字化转型也正成为许多中国企业的核心战略。随着企业上云成为业界趋势,全面使用开源技术和云产品构建软件服务的时代已经到来。如何更好地拥抱云计算、拥抱云原生、用技术加速创新,将成为企业数字化转型升级成功的关键。
阿里云原生应用平台研究员丁宇(叔同)在2020阿里云线上峰会上也提到了“以容器为代表的云原生技术,已经成为释放云价值的最短路径,云原生助力企业全面拥抱云计算”。在他看来,很多企业在数字化转型的过程中,付出了不少的努力与时间,但因为对云原生缺乏了解和实践经验,加之没有好的技术与产品来支撑,导致走了不少弯路。
我们知道,传统的开发模式在迭代速度、频率以及运维方式都难以满足市场快速变化的需求,而云原生追求的就是最大化地利用其技术模式,充分发挥云计算的生产力,使得应用从设计、开发、交付、到管理的思维方式与最佳实践有机结合,从而让这个应用可以最快地创造价值,也就是丁宇所说的“最短路径”。以容器技术为例,容器就是在虚拟化的基础上向上封装了一层,作为云平台与客户交互的新界面之一,应用的构建、分发和交付在容器层面实现标准化,对于企业而言,可以大幅降低 IT 实施和运维成本,从而提升业务创新的效率。
叔同提到:“阿里云的核心优势之一就是阿里巴巴的核心业务运行在云上,形成最好的创新土壤,最先进的技术首先会在阿里巴巴自己的业务体系中进行尝试,得到了大规模的运用,证明其技术的普适性与价值后再开放给客户。”
从2011年迈进容器大门算起,阿里的云原生之路已经走了十年。这期间经历了十年双11的历练,例如2015年全面容器化帮助双11大促实现快速弹性扩容。由于业务的超大规模使得其复杂程度非常高,这也为容器技术带来了更大的挑战。例如在容器镜像分发过程中,一次发布分发几万个镜像,这样巨大的流量是一个不小的挑战。为实现效率的极致要求,阿里云利用P2P技术,实现大规模大批量的快速分发,实现10秒内完成跨机房镜像下载容器启动。 容器技术对于双11的显著影响还包括在具体的混部技术实施中,通过混部技术,阿里巴巴集团范围内能够节省30%左右的IT成本支出,在双11这个特殊时间段里,将每万笔交易成本下降超过75%。
Gartner今年4月发布2020年容器公有云竞争格局报告,阿里云再度成为国内唯一入选厂商。报告显示,阿里云容器服务在中国市场表现强劲,产品形态丰富,在如Serverless容器、服务网格、安全沙箱容器、混合云和边缘等领域,具备良好的技术发展策略。而在今年3月,Gartner第二次公开《竞争格局:公共云容器服务》年度调研报告,报告针对Serverless、Kubernetes、服务网格、容器镜像等十项功能维度进行对比,阿里云和AWS覆盖九项产品能力,产品丰富度领先Google、微软、IBM和Oracle四家厂商。
过去几年,容器服务被各行业企业广泛接受,而阿里云凭借业界最丰富的容器产品家族和容器服务,已经连续数年以超400%的规模高速增长。在2020阿里云线上峰会上,阿里云智能基础产品事业部高级研究员蒋江伟重磅发布了云原生裸金属方案。
新一代容器服务 ACK,可以将最新神龙弹性裸金属实例的强大性能发挥得淋漓尽致,具备极致性能、高效调度、全面安全的特点:
在阿里巴巴内部,容器+神龙裸金属方案以超高性能支撑钉钉抗住有史以来最大的流量洪峰。以前,钉钉100% 部署在普通物理机上,疫情突发之后,政府、企业和学校对在线协作的需求猛增。通过云上神龙裸金属+容器弹性部署方案,快速地实现了钉钉业务应用 10 万核扩容需求。
在外部,尤其是在这次疫情影响下,很多企业面临快速扩容的压力,如在线教育行业,短时间内爆发式的需求,对于任何一家在线教育企业既是机遇,更是挑战。据百家云CEO李钢江透露,疫情期间百家云的业务量在短时间内增长了数十倍,要满足如此迅速的扩容需要,还要在客户无感知的情况下完成扩容,其难度不亚于交付一个新系统。
幸运的是,在这场流量战役之前,百家云已经在阿里云团队的帮助下,优化了自身容器集群架构与规划,通过阿里云容器服务ACK、基于神龙架构的弹性裸金属实例的核心方案,足以从容应对流量洪峰。相比之下,一些没有使用容器的在线教育企业,面对突增的用户量和流量,只能成倍的堆积机器,导致部署时间拉长,业务成本急剧上涨,用户体验也不佳。
为什么要采用神龙裸金属+容器弹性部署方案?因为百家云的需求是三天扩容数十倍,并且百家云的K8s集群对性能要求极高,而“容器+弹性裸金属”的解决方案非常契合这种大流量、高并发的场景。首先,阿里云弹性裸金属服务器规格较高,可以帮助百家云显著提升单个节点的容量。
其次,基于容器化构建方式,可以满足业务快速发放和弹性的要求。神龙服务器完全消除了虚拟化损耗,提升了8%的计算性能,其类物理机特性,可进行二次虚拟化。神龙的性能,加上容器的弹性,形成了天作之合。数据显示,容器运行在云上神龙反而比非云物理机的性能要好10%-15%。主要是因为虚拟化开销已经offload到MOC卡上,神龙的CPU/Mem是无虚拟化开销的,而上云后运行在神龙上的每个容器都独享ENI弹性网卡,能提升13%的网络吞吐量。
第三,神龙服务器的存储带宽和计算带宽分离,能满足百家云业务场景的大量读写需求。使用神龙服务器之后,计算能力大增。并且,百家云通过使用阿里云的高性能NAS服务,并通过水平扩展为4个集群,解决了I/O的瓶颈。
基于以上方案,借助自身的大规模集群管理能力,在短短几天之内,阿里云团队帮助百家云团队有效升级了原有的架构方案,实现了数十倍的扩容,大幅提升了其性能与稳定性,并拥有了应对爆发性规模的能力,用户毫无察觉。
阿里云在云原生领域的投入广泛而深入,在容器、服务网格和Serverless均有丰富的产品服务,目前阿里云已经拥有国内最丰富的云原生产品家族、最全面的云原生开源贡献、最大规模的云原生应用实践、最大的云原生客户群体。其产品体系覆盖八大类别20余款产品,涵盖底层基础设施、数据智能、分布式应用等,可以满足不同行业场景的需求。
阿里云是国内在云原生领域的开源贡献最全面的科技公司,涵盖编排调度、作业管理、无服务器框架等,主导维护etcd、containerd、dragonfly等多个CNCF明星项目的发展,已有超过10个项目进入CNCF landscape。去年1月,阿里云资深技术专家李响成为首个入选全球顶级开源社区CNCF技术监督委员会的中国工程师,致力于推动云原生技术的落地。今年5月,阿里巴巴开源首个边缘计算云原生项目OpenYurt,推动社区在云原生和边缘计算交叉领域的协同发展。
近日,云计算开源产业联盟在OSCAR开源先锋日云原生专场活动上公布了“云原生应用十大优秀案例”评选结果,由阿里云提供技术服务的申通通用云原生计算平台和中国民生银行的场景化数据服务中台双双入选,这次评选的四大标准是:面向传统行业数字化转型,规模化应用云原生技术,提升企业资源利用率及研发效率,助力企业业务创新发展。申通和民生银行两大案例因为在云原生和数据服务中台的技术实践中表现出色,最终脱颖而出。
以申通为例,原有IDC系统帮助申通早期业务快速发展,但也暴露了不少问题,传统IOE架构,各系统架构的不规范,稳定性,研发效率等都限制了业务发展需求。在跟阿里云多次技术交流之后最终确定阿里云为唯一合作伙伴,为申通提供稳定的计算,数据处理平台。
申通原架构是基于VMware+Oracle数据库的架构,通过上阿里云,全面转型基于Kubernetes的云原生架构体系。主要有两点:
目前申通核心业务系统已经在云上完成流量承接,每天处理订单量在千万级别,处理物流轨迹在亿级别,每天产生的数据量在1T,使用1300+个计算节点来实时处理业务。正如申通上云总负责人提到的,“申通通过阿里云进行全面转型,基于Kubernetes的云原生架构体系,在成本、稳定性、效率、赋能业务四个维度获得显著成效,这些云原生技术带来的价值,是申通转为使用公有云作为主要计算资源的核心驱动力。”
在容器技术上,阿里云的目标是构筑新基石、新算力、新生态。帮助企业更好地支撑混合云、云边一体的分布式架构和全球化的应用交付。据 Gartner 分析,未来 80% 以上的企业都会采用混合云的架构,打造混合云和云边一体的方案也是阿里云一直在关注的方向。未来云的架构是动态、混合的架构——云边端一体,公共云能力向边缘设备端拓展,需将计算能力、AI推进到边缘,容器提供一致化的方式对云边端进行统一的应用部署和交付。基于云原生软硬一体化的创新技术,通过阿里云提供的强大算力来加速企业的智能化升级:容器服务结合神龙架构发挥性能和弹性,支持含光800芯片的调度、共享,极致优化深度学习场景的效率、成本。
容器、Kubernetes、云原生正在成为云时代的技术新标准,重塑整个软件生命周期,阿里云通过云原生正在帮助企业客户和开发者最大化利用云的能力,最大化发挥云的价值。
本文系作者在时代Java发表,未经许可,不得转载。
如有侵权,请联系nowjava@qq.com删除。