什么是 Kafka 服务?

复制 URL

Kafka 服务是 Apache Kafka 提供的一种云服务产品,是一个数据流平台。 

Apache Kafka 在大规模部署时非常复杂,尤其是在混合云环境中。所以,许多流数据用户通常会选择 Kafka 服务,将基础架构和系统管理工作交给服务提供商负责。

免费试用 Kafka

Apache Kafka 是一个开源分布式数据流处理平台,可以实时发布、订阅、存储和处理数据流。它旨在处理多种来源的数据流,并将它们交付给多个消费者。

Apache Kafka 专用于处理大量数据,是适合企业应用的解决方案,它擅长管理流数据,同时具有快速、可横向扩展和容错等特性。

Apache Kafka 非常适合用于应对大数据挑战。在许多数据处理用例中,如物联网和社交媒体,数据呈指数级增长,或许很快就会让按照当今数据容量构建的应用不堪重负。

对于使用微服务的开发人员来说,在使用异步事件驱动集成时,Apache Kafka 是一个很好的选择,它可以增加同步集成和应用编程接口(API)的使用。

了解关于 Apache Kafka 的更多信息

红帽资源

流数据是指实时信息的持续流动,通常表示为数据集中发生的变化或事件的运行日志。

数据流用例可能涉及任何需要对事件进行实时响应的情况——从金融交易到物联网(IoT)数据到医院患者监控。 

与流数据交互的软件能够在数据到达时进行处理,通常使用事件驱动架构模型。

使用事件流模型时,事件使用者可以读取流的任何部分,并且可以随时加入流。基本的数据流事件包括一个密钥、一个值和一个时间戳。数据流传输平台会获取事件和流程,或转换事件流。事件流处理可用于查找数据流中的模式。

了解关于流数据的更多信息

尽管 Apache Kafka 具有诸多优势,但要在混合云环境中大规模部署仍然很困难。流数据服务的要求可能比其他数据应用更为严格。 

数据流必须实时提供有序的信息,必须一致且高度可用。数据流中的原始数据量可能会迅速增加。数据流需要优先考虑适当的数据排序、数据一致性和可用性,即使是在活动高发的时候。数据流在设计时,还必须确保能在部分系统出现故障时保持耐久性。

在分布式混合云环境中,流数据集群需要注意一些特殊事项。Apache Kafka 数据代理是有状态的,在重新启动时必须保留。扩展时需仔细编排,确保消息传递服务按预期运行,且不会丢失任何记录。

因为这些挑战,许多 Apache Kafka 用户会选择托管云服务,将基础架构和系统管理工作交给服务提供商负责。

使用 Kafka 服务具有多种优势,包括:

  • 该服务会实施基础架构管理,让团队能将精力放在应用开发和其他核心竞争力上。
  • 随着团队会立即开始开发,并快速采用新技术,可以带来更快的应用速度。
  • 大型的附加云服务生态系统,可以简化基于流的应用的交付。
  • 通过连接器将 Kafka 代理链接至分布式服务,使其能够在应用和系统之间轻松使用和共享流数据。
  • 基于使用量计费,让客户能在需要时按具体需求付费。

在托管 Kubernetes 平台上运行时,Apache Kafka 集群可以跨越现场和公共云、私有云或混合云,并且使用不同的操作系统。
 

进一步了解在 Kubernetes 上运行的 Kafka
中心

红帽官方博客

获取有关我们的客户、合作伙伴和社区生态系统的最新信息。

所有红帽产品试用

我们的免费试用可让您亲身体验红帽的产品功能,为获得认证做好准备,或评估某个产品是否适合您的企业。

扩展阅读

什么是应用集成?

应用集成可将不同的系统和应用连接起来,使它们可通过交换数据和使用服务进行协作。

一文看懂 API 是什么,有什么用?- 红帽

应用编程接口(API)是一组用于构建和集成应用软件的定义和协议。通过向合作伙伴或公众提供您的 API,可以:创造新的收入渠道,扩大您的品牌覆盖范围,通过外部开发和协作,推动开放创新或提高效率。

一文看懂 GraphQL 是什么?都有哪些优缺点 - 红帽

GraphQL 是一种用于应用编程接口(API)的查询语言和服务器端运行时,作为 REST 的替代方案,它可以使客户端准确地获得所需的数据,没有任何冗余。让 API 变得快速、灵活并且为开发人员提供便利。

集成 相关资源