分布式云容器平台ACK One(Distributed Cloud Container Platform for Kubernetes)是阿里云面向混合云、多集群、分布式计算、容灾等场景推出的企业级云原生平台。ACK One可以连接并管理您任何地域、任何基础设施上的Kubernetes集群,并提供一致的管理和社区兼容的API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。本文介绍ACK One的产品优势、功能和应用场景。
ACK One控制台操作入口
产品优势
提供一致界面和API,对集群、计算、网络、存储、安全、监控、日志、作业、应用、流量等提供企业级运维管控能力。
面向云突发的业务波峰,业务自动或定时触发弹性扩容和缩容云上资源,降低综合业务成本。
开箱即用的备份中心,提供应用和数据保护,并支持跨地域完整应用和数据一体迁移,以及应用多活部署的快速实施。
提供了全域的应用分发、任务分发、流量治理能力,帮助企业客户基于自己的业务分布和数据管控诉求,全面构建安全、标准、现代化的云原生IT架构。
一键部署经云端大规模验证的企业级产品、组件到任意Kubernetes集群,从而获得增强的安全、调度、AI大数据加速器能力。
产品功能
为了应对分布式云场景多种挑战,ACK One提供以下功能。
注册集群
通过ACK One注册集群,您可以将来自不同供应商和不同位置的K8s集群统一接入到阿里云容器服务ACK控制台,实现多个集群统一管理,并使用容器服务ACK丰富的集群扩展能力,同时获得云上弹性计算资源。
云上云下一致的运维体验:与阿里云容器服务ACK集群一样,可以在本地数据中心K8s集群和其他云服务的K8s集群中使用以下能力。
可观察性:集群控制面监控,集群数据面监控,应用实时监控,日志收集与查询,成本分析FinOps。
安全合规:认证授权,集群审计,策略管理,配置巡检。
备份恢复:提供云上备份、恢复、迁移一体化的方案,支持数据和应用的云容灾。
微服务治理:支持通过阿里云服务网格ASM或者微服务引擎MSE管理K8s集群中的微服务。
云上弹性:可以将阿里云ECS节点和弹性容器实例ECI加入到本地K8s集群中,由本地K8s集群调度云上计算资源,应对IDC资源不足和突发业务流量。
智能调度
利用容器服务ACK调度器,实现Gang Scheduling、CPU拓扑感知、ECI弹性调度等高阶调度能力。
利用分布式缓存ACK Fluid应对存算分离场景,提升访问效率和减少带宽占用。
注册集群相关文档,请参见注册集群概述。
多集群舰队
当您同时运行多个K8s集群时,可以通过多集群舰队ACK One Fleet,关联多个集群,并通过多集群舰队提供的统一控制面,同时管理多个关联集群。
多集群舰队控制面基于K8s控制面构建,提供标准Kubernetes API。
多集群舰队可以接入多个K8s集群,非容器服务ACK集群,可以先通过注册集群接入。
GitOps应用分发:托管开源ArgoCD,实现GitOps多集群应用分发。
流量管理:集成MSE云原生网关,实现多集群应用南北流量控制;支持多集群Service,实现多集群东西流量控制。
作业分发:离线作业多集群调度,选择适合的集群运行离线作业。
全局监控:多集群监控大盘,一个监控大盘查看所有集群的监控指标。
多集群舰队相关文档,请参见多集群舰队概述。
分布式工作流Argo集群
分布式工作流Argo集群采用无服务器模式,使用阿里云弹性容器实例ECI运行离线工作流。
成本优化:控制面免费,数据面按使用计费,Spot优化成本。
高IO带宽:通过分布式数据缓存,提供20+ GB/s聚合读带宽,支持跨地域访问。
资源预测:通过负载感知自动调整资源规格。
规模化计算:支持千级并发工作流,数万计算任务。
事件驱动:支持Git、阿里云MNS、OSS等事件源触发工作流自动运行。
分布式工作流Argo集群相关文档,请参见分布式工作流Argo集群概述。
应用场景
场景1:注册集群,接入云端构建混合云
场景描述
云下IDC自建集群:打通集群网络,实现云下云上资源共享。
按需在云上伸缩计算资源和应用:业务高峰期,在云端快速扩容,把部分业务流量引到云端。
场景2:注册集群,云下K8s集群使用云产品扩展集群能力,云上云下集群一致运维体验
场景描述
一致运维体验:ACK统一的运维能力下沉到数据中心集群和第三方公有云集群。
增强可观测性:支持日志、监控、和事件收集,享受云上同等的运维体验。
安全能力提升:一键开启审计、安全巡检、节点风险探测,策略治理。
微服务治理:阿里云微服务引擎MSE与服务网格ASM提供微服务治理能力。
场景3:注册集群 ,备份容灾、混合云、同地域、跨地域数据容灾
场景描述
应用上云:提供跨地域和数据中心的应用一致性备份和秒级恢复,帮助您的业务应用快速上云。
数据灾备:提供跨地域和数据中心的有状态应用备份,支持备份策略和恢复策略。持续容灾备份到云端,提高勒索防护的防范能力。
业务容灾:提供跨地域和数据中心的应用和数据异地备份容灾和定时备份能力。
异地多活:提供兼容Kubernetes,快速构建两地三中心容灾系统,帮助您搭建高可用系统。
场景4:注册集群,协同调度器赋能AI和大数据
场景描述
AI算法开发:提供全面的任务、配额、可观测性管理。
AI训练:支持拓扑感知和丰富的任务调度策略,提升训练效率。通过存算分离架构,大幅提升分布式数据训练速度。支持跨集群作业任务调度,提供面向多集群优化的TensorFlow、Spark、CronJob等作业任务分发和调度。
AI推理:提供GPU共享,资源利用率可提高约300%。支持异构资源弹性伸缩,提供云上云下统一的弹性调度管理。
CPU智能调度:针对裸机的智能CPU调度和NUMA感知。
场景5:多集群舰队,多集群GitOps应用分发
场景描述
高可靠性:Git仓库作为应用部署的唯一来源,可提供版本控制、变更审批流程、代码回滚和审计能力。
高安全性:开发者无需任何Kubernetes集群权限,仅需要Git仓库权限。
应用持续部署:Git仓库中应用状态与Kubernetes集群应用状态自动同步。
应用多集群分发:支持将应用同时发布到多个集群,并支持差异化配置。
场景6:多集群舰队,多集群网关实现应用同城容灾
场景描述
多集群网关:多集群南北流量管理,简化管控成本。
全局Ingress:使用Ingress规则控制七层流量,实现基于权重、副本数、自动fallback等策略。
场景7:分布式工作流Argo集群,通用离线任务与复杂工作流编排与调度
场景描述
托管Serverless Argo控制面:完全兼容开源Argo Workflow编排标准。
多地域多可用区:保证资源供给,并结合Spot降低成本。
分布式数据缓存:应对存算分离挑战,提高数据访问效率,降低计算成本。
业务场景:仿真计算、科学计算、数据处理、持续集成。