概述
高可用性是指保护单个站点上的基础架构或应用,确保其持续运行。它的目的是利用冗余访问路径和组件弹性来减少计算堆栈中的单点故障。如果环境设计时纳入了高可用性的概念,那就意味着各项服务具备内置的弹性,可以自行恢复。这些服务的恢复选项可能包括:
- 故障时重启;
- 允许故障节点重新启动;
- 故障硬件上的工作负载可以重新部署到该环境中的其他位置;
- 网络路径故障将导致事务重新发送至服务或发送至服务的其他实例。
高可用性的重要作用是确保应用能够在不停机的情况下运行并处理意外故障。进一步了解如何为您的应用、集群和混合云平台带来高可用性。随着容器、Kubernetes 和无服务器等技术在应用开发方面带来新的机遇,但仍然需要制定恢复计划,以防发生故障。
超越实现您的恢复目标
灾难恢复(DR)是指以地理分布的方式保护基础架构或应用,从而尽可能减少业务影响。DR 的目的是实现比传统高可用性更长距离的自动恢复,并将恢复扩展至不同的群集。在应用一次只能用于一个站点的环境中,站点间的迁移可能是自动化的,需要拥有权限的人决定在站点之间移动计算服务。这样做是因为站点间进行故障切换时,需要一定的技术成本来重新同步应用。减少从事故恢复的时间对企业的成功至关重要。