运维弹性为什么很重要?

复制 URL

运维弹性指系统能够抵御故障和停机,并且在发生这些状况时能够恢复正常。如今的企业越来越重视管理第三方风险,以及应对特定云基础架构提供商发生故障的情况。

银行、保险和其他金融服务机构而言,运维弹性也可具体指企业能够在面临大规模中断时提供关键的服务。

为什么数字化运维弹性如今变得很重要?

早在新冠疫情之前,数字化服务的快速扩张就已推动金融机构将更多应用转移到第三方技术平台上(尤其是云基础架构提供商),而这场疫情更为这一转变按下了加速键。

尽管金融服务机构一直在使用第三方技术,但加快向这些数字化服务转变也产生了一些风险,为了应对这些风险,欧洲、中东和非洲地区(EMEA)的监管机构引入了更多的监管和控制要求,旨在确保金融机构的数字化运维具备足够的弹性,这一趋势逐渐成为全球金融领域的普遍实践。

其中欧盟的一项关键法案《数字化运维弹性法案(DORA)》,特别关注到了金融机构对大型云基础架构提供商的依赖。监管机构将这种重度依赖视为潜在的系统性风险。他们认为,如果一家主要云提供商发生某些状况,其影响会蔓延至全球各地,动摇金融市场的稳定和信心。DORA 希望通过监管金融服务提供商的运维弹性来缓解这种风险。

运维弹性如何应用到云平台?

对于消费者而言,尽管对可穿戴智能手表等物联网技术感兴趣,但不免十分担心与持续联网相伴相生的隐私和安全问题。消费者的这种顾虑在各类企业物联网项目中普遍存在,尤其当终端用户为普通大众时。

企业物联网解决方案可以让企业改进现有业务模式,并与客户和合作伙伴建立新的联系,但这个过程可能并不容易。智能设备系统产生的数据量可能极为庞大(通常被称为大数据)。将大数据整合到现有系统中并设置数据分析以对其采取行动,也是一个复杂的过程。

在打造物联网系统时,物联网安全性是一个重要的考虑因素。尽管挑战艰巨,但对于许多公司而言,物联网仍然值得一试,而且几乎各行各业都有企业物联网应用的成功案例。

运维弹性和数字化运维弹性趋势对金融服务企业和机构而言很重要,这是由其业务模式核心中的多个因素决定的。

1.关键服务营收损失:面对导致关键服务中断并破坏业务连续性的中断,如果客户无法使用这些服务,金融服务企业和机构的营收损失估计可达每小时 500 万美元。此外,如果依赖这些关键服务的客户、民众和合作伙伴在重要时刻无法获得所必备的关键服务,他们有可能会蒙受严重的经济损失。
 

2.制裁和罚款成本:金融服务机构必须遵循严格的监管要求。关键服务中断可能导致不合规,进而引来罚款、处罚或制裁,从而对营收产生负面冲击。

客户、监管机构和合作伙伴等利益相关者都希望能不间断地享受关键服务,即使在出现技术问题时也不受影响。随着企业越来越依赖通信服务提供商(CSP)等第三方解决方案,满足这种期望就变得愈加重要。因此,如今的监管条例已经开始强调企业对确保这些服务的可用性和连续性负有最终责任。

DORA 等应全球数字化运维弹性趋势而生的法案最早可在 2025 年成为正式法律,企业要在合规方面投入的成本可能会进一步膨胀。而且,DORA 不是唯一将运维弹性要求编写成文的法案。其他监管机构也提出了类似的要求,例如英国的审慎监管局(PRA)和金融行为监管局(FCA)等。

因此,尽管北美、拉丁美洲(LATAM)或亚太地区(APAC)的机构可能会认为 DORA 仅限于欧洲,但他们也可能会受到类似 DORA 监管的影响,例如 2022 年 6 月生效的加拿大新版金融消费者保护框架。
 

3.声誉成本:身处在数字化环境中建立信任的时代,因缺乏运维弹性而导致服务中断,可能会对客户的看法和态度产生关键的影响随着越来越多金融服务机构依赖数字化平台提供服务,消费者已经习惯于享受不间断的体验。任何服务中断都可能侵蚀客户对公司的信任,并可导致客户和营收方面的损失。

随着市场竞争愈发激烈,消费者在挑选服务提供商时有许多选择。坚实的信任基础或许是留住老客户和吸引新客户的一个决定性因素。通过确保服务的可靠性和可用性,公司可以培养稳定的客户群,加深其信任。
 

4.扰乱市场:如今的公司是高度互联的。即使只是一家机构出现问题,也有可能会蔓延开来并扰乱国家经济。

这种现象不仅限于金融服务业,通信和能源等关键产业亦是如此。企业之间的关系犬牙交错、息息相关,因此运维中断可能会在更广范围内产生深远的影响。

这种错综复杂会带来一系列挑战。对于预防系统性中断,确保业务连续性和缓解风险变得越来越重要。公司必须投资于可靠的风险管理战略,包括强有力的网络安全措施、灾难恢复计划和运维弹性。此外,促进跨行业合作和沟通也有助于识别漏洞并制定最佳实践,以防范潜在的连锁效应。通过正面应对这些挑战,公司就能够为全球经济的稳定和韧性做出贡献。

5.日益抬高的关键服务级别要求:服务的数字化程度越来越高,导致金融服务机构的运维方式发生了转变。如今,全天候、始终可用的服务已经成为标准,几乎所有底层系统和服务都承担着关键的使命。只有保持运维弹性,才能维护这类不断增长的客户服务套件,同时最大限度降低代价高昂的服务中断风险。
 

6.第三方工具之间缺乏互操作性:随着金融服务越来越多地使用第三方工具,如果这些工具之间没有良好的互操作性,业务连续性就会面临风险。因此,要保障运维弹性,所用的工具需要能够在不同的第三方工具之间创建一个统一的平台。

此外,许多互连/复杂的平台和环境,如内部、外部、云服务和边缘等,也要一个统一的平台来共同提供最终用户服务。

红帽资源

现代云平台可以让机构花费更低的成本和更少的精力来缓解运维风险。尽管单一基础架构提供商可以制定弹性策略,并可在发生灾难时提供迁移到其他区域或地区的可移植性,但这不能解决潜在的系统性第三方问题,导致最终只能与提供商终止合作。

红帽提供的云服务可以增强 Kubernetes,因此您可以在多个云环境下以统一的方式进行运维。这些服务可为希望管理风险和提高弹性的客户提供以下好处:

  • 管理 Kubernetes 集群:任何地方皆可运维,轻松管理您的任何 Kubernetes 集群。 
  • 加快开发到生产的速度:借助自助服务部署,加快应用开发流程。
  • 提高应用可用性:在分布式集群上快速部署传统应用和云原生应用。
  • 自动执行集中管理:借助可自动交付应用的自助服务集群部署,释放 IT 部门的生产力。
  • 简化合规:通过跨集群的集中化策略实施,轻松精简安全合规。
  • 降低运维成本:通过统一的管理界面,降低运维成本。

红帽® OpenShift® 是一个可以大规模构建、现代化并部署应用的统一云平台。此外,红帽 Kubernetes 高级集群管理使用内置安全策略从单个控制台控制集群和应用。通过管理多个集群,在多个集群上大规模实施策略,进一步提升红帽 OpenShift® 的价值。这样,您就能有效地确保合规性,监控使用情况并保持一致性。

进一步了解红帽高级集群管理

红帽咨询和红帽培训可帮助广大客户开发兼顾可移植性和高可用性的云原生应用,从而在灾难恢复中快速复原关键的数据和工作负载。 

此外,红帽广泛的合作伙伴生态系统能提供更多丰富的功能,更好地满足云和非云系统和环境中的业务连续性管理需求。

探索红帽 Kubernetes 高级集群安全防护

一起探讨红帽可以如何帮助您提高运维弹性
中心

红帽官方博客

获取有关我们的客户、合作伙伴和社区生态系统的最新信息。

所有红帽产品试用

我们的免费试用可让您亲身体验红帽的产品功能,为获得认证做好准备,或评估某个产品是否适合您的企业。

扩展阅读

什么是机密管理?

机密管理是一种对日常运维所需的敏感信息进行保密处理的方法。

什么是基于角色的访问控制(RBAC)?

基于角色的访问控制是一种管理访问权限的方法,根据用户在团队或更大部门中的角色来管理用户对系统、网络或资源的访问权限。

简单理解测试的左移与右移

要实施左移和右移,即意味着在软件开发生命周期的每个阶段实施持续测试。

安全防护 相关资源

相关文章