什么是事件驱动自动化?

复制 URL

事件驱动自动化指的是对 IT 环境中不断变化的条件做出自动响应的过程,目的是帮助加快问题解决速度并减少日常的重复性任务。 

事件驱动自动化有助于将数据、分析和服务请求连接到自动化操作,从而让一些活动,比如响应服务中断或调整 IT 系统的某些方面,都可以一次性快速完成。它通常采用 “如果满足某个条件,就自动触发(IFTTT)” 的模式进行自动化,有助于 IT 团队掌控在何时以何种方式执行特定的操作。它还有助于管理混合云和边缘环境的复杂性,同时让团队能够专注于其他优先事项。

事件是指对 IT 基础架构管理或 IT 服务交付具有重要意义并可被检测到的任何情况。事件通常用第三方监控工具来识别,它一般表示在应用、硬件、软件、云实例或其他技术中发生了重要事情或状态变化。

事件的管理和响应可能并不容易,因为事件的具体情况和所需的响应在整个 IT 环境中可能会有很大差异。有些事件需要立即采取行动来解决问题,比如在出现安全风险时关闭某项技术或系统。而另一种事件可能只是一种通知,提醒某个应用程序正出现一些压力或负荷过大的迹象,但并不需要立即采取行动。事件驱动自动化解决方案应该足够灵活,能够为各种事件指定最适合的行动方案,并且适应将来出现的新事件类型。

红帽资源

在 IT 环境中,由事件驱动意味着将数据和服务请求连接到自动化操作。这样,当特定事件发生时,系统可以自动触发相应的操作,而不需要 IT 团队人工干预。 

事件驱动自动化允许系统在事件发生时启动预定义的自动化响应。例如,系统停机可能会触发一个事件,该事件将自动执行特定的操作,如记录问题工单、收集故障排除所需的事实,或执行系统重启。由于这些操作是预定义和自动化的,因此能够以比手动完成必要步骤更快的速度执行。 

类似地,事件驱动自动化可帮助团队执行各种额外的 Day2 运维,例如配置管理和偏移问题解决;边缘设备管理;置备;跨存储、数据库和应用的调优和扩展,以及用户管理等。

随着企业在混合云环境和边缘位置布局自动化时更加注重整体的战略目标和长期规划,它们通常会从自动执行对管理和服务交付至关重要的 IT 操作开始。虽然自动化可以提高这些流程的速度和灵活性,并可最大限度减少人为错误,但有些事件依旧需要手动进行故障排除和信息收集,而这可能会延迟问题解决并干扰日常运维。 

事件驱动自动化可以帮助团队从被动应对转向采取主动的 IT 管理方法,并通过完整的端到端自动化来精简 IT 操作。具备事件处理能力的解决方案可将自动化的使用扩展到不同的领域、流程和地理位置,确保操作一致性、弹性和效率,从而提高自动化的成熟度。

事件驱动自动化能够实现更加快速的 IT 响应,例如缩短服务中断的平均解决时间(MTTR),并且不需要团队采取通常会延长工作时间或在非工作时段发生的手动操作。事件驱动型解决方案可用于自动执行服务工单创建、事实收集和响应步骤,当针对某项技术检测到变化时,会触发这些步骤。增强了事件和响应的可观测性后,团队可以主动解决潜在的和重复发生的问题。

事件驱动自动化有助于 IT 团队:

  • 选择理想的任务进行自动化,然后让 IT 领域专家(如网络工程师)灵活地运用自动化来满足关键需求。 
  • 将现有的运维知识融入到自动化决策和行动中。
  • 高效地完成重复性任务,更快地交付服务。
  • 减少低级别的任务,将宝贵的资源投入到其他优先事项。
  • 迅速解决容易恶化的问题,避免它们成为紧迫问题。
  • 自动执行网络边缘基础架构DevOps安全性等领域的重复性任务。

获取关于事件驱动自动化的影响的报告

在开始使用事件驱动自动化前,首先要确定哪些重复而单调的任务是 IT 团队频繁地以手动方式完成的。一些常见用例包括:

自动化修复
某种类型问题的解决方案往往是一系列可重复的步骤。事件驱动自动化可以将用来标记问题的分析或工单连接到将能解决问题的自动化步骤。也就是说,团队可以自动地处理工单,基于已知系统行为模式解决问题,或响应受监控的事件,例如有关系统需要更多容量的警报。 

丰富工单信息
工单管理的一个常见问题是工单中包含的信息不够充足,无法进行有效的根本原因分析(RCA)。事件驱动自动化可以用于与相关系统进行交互,收集数据,并使用详细的信息更新相应的工单,以便进行更彻底的 RCA 流程。 

自动化扩展平台
应用工作负载和平台要靠自动化置备来确保业务连续性并减少对客户的潜在影响。无需等待手动置备,IT 团队可以将容量和性能指标与事件驱动自动化相结合,自动置备容器、云基础架构、虚拟机和其他技术。除了自动扩展之外,来自应用工作负载的事件还可触发开发和测试环境置备,以加快创新过程。

缓解风险
借助事件驱动自动化,一旦发现风险,就可以立即启动安全响应。 例如,如果在防火墙上发现了风险,事件驱动型解决方案可以立即关闭防火墙并创建服务工单,从而减少暴露于安全漏洞的机会。事件驱动自动化不仅有助于确保快速解决服务中断问题,也可以主动监控导致服务中断的迹象,防止未来出现进一步问题,并保障 IT 的稳定性。

自动化调优和管理容量
对于许多 IT 功能来说,如管理 Web 应用程序和监控存储池,持续的调优和容量管理是必要的。对于一些团队,调优工作每月要进行数千或数万次,因此手动完成非常耗时。事件驱动自动化可以根据预先确定的规则来响应这些类型的事件,从而解决存储容量不足等问题并触发自动调整。通过从这个调优过程中剔除手动步骤,团队能以更高效、更具成本效益的方式及时响应其他关键业务需求。

自动化扩展
与调优一样,根据用户需求手动扩展应用的存储、处理和网络带宽可能非常麻烦。例如,事件驱动自动化解决方案可以监控缓冲池,在达到限值时自动调整大小。

报名参加有关事件驱动自动化入门的网络培训课堂

作为红帽® Ansible® 自动化平台的一部分,Event-Driven Ansible 可提供所需的事件处理能力,在任何 IT 领域推进端到端自动化并自动执行耗时的任务。 

Event-Driven Ansible 是一个可扩展的、响应快速的自动化解决方案,能够处理包含离散、可操作情报的事件。它让 IT 团队能够判断对特定事件的适当响应,然后执行自动化操作来解决该事件或进行补救。 

IT 服务管理任务,例如工单增强、问题修复和用户管理等,是理想的起点,但 Event-Driven Ansible 足够灵活,可自动执行整个 IT 环境中各式各样的任务。Event-Driven Ansible 将分析与自动化操作联系起来,可提高 IT 的弹性和响应能力,同时使团队能够专注于更有价值的工作。

Event-Driven Ansible 可以帮助您:

  • 加快创新步伐。让团队专心完成最擅长和最关键的工作,从而帮助 IT 为业务创造更高的价值。
  • 更高效地实施事件驱动自动化。使用人类可读的 YAML 语言,通过 Ansible Rulebook 编写自动化规则来提供响应指令。需要时还可嵌入 Ansible Playbook。根据需要进行更改。请注意,Ansible Rulebook 类似于 Playbook,但使用“如果满足某个条件,就自动触发”的条件格式,来在事件发生时做出响应。  
  • 提升速度和响应能力。迅速解决问题,避免它们成为紧迫问题。改进平均解决时间(MTTR)。减少低级别的任务,将宝贵的资源优化到其他优先事项。
  • 灵活地工作。从来源到规则再到操作,使用模块化设计在整个运维中应用事件驱动自动化。订阅许多事件来源。编写规则,以您想要的方式实施操作。
  • 跨 IT 领域进行调整。利用统一的自动化平台,自动执行网络、边缘、基础架构、DevOps、安全性和云等领域的重复性任务。
  • 确保一致性。在 Ansible Rulebook 中将运维知识编写为代码,以便每次都以相同方式做出响应。最大限度减少因工作量大、任务重复和员工倦怠而导致的人为错误。

Ansible 自动化平台是一个在开源创新基础上打造的综合性自动化解决方案,可针对您的企业进行强化,让您能够提高生产力并缩短新项目完工时间。借助红帽订阅,您可以获得认证的内容、可靠的合作伙伴生态系统、托管管理服务的访问权限,以及生命周期技术支持,让您的团队能够在整个组织中扩展自动化。红帽已成功服务数千客户,积累了能提供专业洞察和指导的宝贵经验。

在这个自定进度的互动实验室中,您可以学习如何使用 Ansible 自动化平台中的事件驱动自动化。借助实训示例,您将探索它的工作方式,以及如何运用它来解决您的 IT 运维挑战。

开始体验事件驱动自动化

中心

红帽官方博客

获取有关我们的客户、合作伙伴和社区生态系统的最新信息。

所有红帽产品试用

我们的免费试用可让您亲身体验红帽的产品功能,为获得认证做好准备,或评估某个产品是否适合您的企业。

扩展阅读

什么是 CloudOps?

CloudOps(云运维)结合了 IT 运维和管理云环境的最佳实践。

什么是云迁移?自动化能提供哪些帮助?

云迁移是指将应用、工作负载和数据迁移到公共云或私有云的过程。

一文了解什么是 Ansible 模块?

Ansible® 模块是一个用于在本地计算机、API 或远程主机上执行操作的小型程序。模块通常以 Python 代码的形式表示,并且会包含一些元数据,这些元数据定义了在何时、何处执行特定自动化任务。

自动化与管理 相关资源

特色产品

相关文章