O que é alta disponibilidade e recuperação de desastres para containers?

Copiar URL

À medida que as organizações migram os sistema para a nuvem híbrida, a resiliência costuma ser uma preocupação essencial. A capacidade de resistir a erros e falhas sem a perda de dados é fundamental para oferecer serviços confiáveis de aplicações que contribuam para a continuidade dos negócios. 

Além disso, as aplicações essenciais precisam continuar com o bom desempenho, mesmo com a falha de componentes. As aplicações sozinhas têm um limite de resiliência, dependendo da infraestrutura subjacente de serviços de dados para obter resiliência e desempenho em condições de falha.

 

A alta disponibilidade é a proteção da infraestrutura e das aplicações em um único local, o que viabiliza as operações contínuas. A meta é reduzir os pontos de falha individuais em um stack de computação, geralmente usando caminhos de acesso redundantes e resiliência de componentes. A inclusão de conceitos de alta disponibilidade em um ambiente significa que os serviços têm resiliência integrada e podem se recuperar por conta própria. Para se recuperarem, esses serviços podem reinicializar em caso de falha, possibilitar a reinicialização de um nó com problemas, reimplantar uma carga de trabalho em um hardware com falha em outro local no ambiente ou enviar novamente transações para o serviço ou a uma outra instância do serviço no caso de uma falha do caminho de rede.

A alta disponibilidade é essencial para garantir a operação das suas aplicações sem downtime. Ela é capaz de resolver falhas não previstas. Tecnologias como containers, Kubernetes e serverless apresentam novas oportunidades de desenvolvimento de aplicações, mas ainda precisam de um plano de recuperação para o caso de falhas.

Recursos da Red Hat

A recuperação de desastres (DR) é a capacidade de recuperar e manter aplicações essenciais para os negócios de desastres naturais ou criados pelas pessoas, protegendo a infraestrutura ou as aplicações de uma maneira geograficamente distribuída, para reduzir ao máximo o impacto nos negócios. É a estratégia de continuidade geral dos negócios das grandes organizações, projetada para preservar a continuidade das operações de negócios durante grandes eventos adversos. A meta é viabilizar a recuperação automática ou automatizada em distâncias mais longas do que a alta disponibilidade tradicional, ampliando-a para um cluster diferente. Em ambientes em que a aplicação é restrita a um site por vez, a migração entre sites pode ser automatizada e precisa de uma pessoa com autoridade para tomar a decisão de transferir os serviços entre sites. Isso é necessário quando a tecnologia tem um custo para sincronizar novamente as aplicações em casos de failover entre sites.  Reduzir o tempo de recuperação de incidentes é fundamental para o sucesso da sua organização.

A capacidade de DR regional oferece replicação de metadados e dados persistentes ao volume em todos os sites que são geograficamente dispersos. Na nuvem pública, isso seria semelhante à proteção de uma falha regional. A DR regional mantém a continuidade dos negócios durante a indisponibilidade de uma região, aceitando determinadas perdas de dados em uma quantidade previsível. Isso costuma ser expresso como objetivos de ponto de recuperação (RPO) e objetivos de tempo de recuperação (RTO).

O RPO é uma medida da frequência com que você faz backups ou snapshots de dados persistentes. Na prática, o RPO indica a quantidade de dados que serão perdidos ou precisarão ser inseridos novamente após uma interrupção.

O RTO é a quantidade de downtime que uma empresa pode tolerar. O RTO é a resposta à pergunta: "Quanto tempo seu sistema demora para se recuperar após a notificação de uma disrupção dos negócios?"

Confira a documentação sobre como configurar o Red Hat OpenShift Data Foundation para a recuperação de desastres regional com o gerenciamento avançado de clusters.

Nossos parceiros de ecossistema trabalham conosco para validar as soluções com nossas plataformas e viabilizar uma estratégia robusta de proteção de dados e recuperação de desastres. Conheça melhor nossos parceiros de infraestrutura de rede e armazenamento.

Hub

Blog da Red Hat

Tudo relacionado à Red Hat: soluções, treinamentos e certificações Red Hat, casos de sucesso de clientes, novidades dos nossos parceiros e notícias sobre projetos das comunidades open source.

Teste as soluções da Red Hat

Você sabia que a Red Hat oferece versões de teste gratuitas de suas soluções? Aproveite e obtenha experiência prática, prepare-se para uma certificação da Red Hat ou avalie na prática se a solução é adequada para ao caso de uso.

Leia mais

What is the Kubernetes Java client?

The Kubernetes Java client is a client library that enables the use of the Java programming language to interface with Kubernetes.

Kubernetes na AWS: comparação entre K8s autogerenciado e plataforma de aplicações gerenciada

Conheça as vantagens de usar o Kubernetes (K8s) na AWS e entenda as diferenças entre o Kubernetes autogerenciado e uma plataforma de aplicações gerenciada.

O que é hosted control plane?

Hosted control plane refere-se ao plano de gerenciamento desacoplado que permite o controle e gerenciamento consolidados dos principais componentes do plano de controle.

Containers: leitura recomendada

Artigos relacionados