O que é alta disponibilidade e recuperação de desastres para containers?

Publicado 10 de outubro de 2022•3 minutos (tempo de leitura)

À medida que as organizações migram os sistema para a nuvem híbrida, a resiliência costuma ser uma preocupação essencial. A capacidade de resistir a erros e falhas sem a perda de dados é fundamental para oferecer serviços confiáveis de aplicações que contribuam para a continuidade dos negócios.

Além disso, as aplicações essenciais precisam continuar com o bom desempenho, mesmo com a falha de componentes. As aplicações sozinhas têm um limite de resiliência, dependendo da infraestrutura subjacente de serviços de dados para obter resiliência e desempenho em condições de falha.

A alta disponibilidade é a proteção da infraestrutura e das aplicações em um único local, o que viabiliza as operações contínuas. A meta é reduzir os pontos de falha individuais em um stack de computação, geralmente usando caminhos de acesso redundantes e resiliência de componentes. A inclusão de conceitos de alta disponibilidade em um ambiente significa que os serviços têm resiliência integrada e podem se recuperar por conta própria. Para se recuperarem, esses serviços podem reinicializar em caso de falha, possibilitar a reinicialização de um nó com problemas, reimplantar uma carga de trabalho em um hardware com falha em outro local no ambiente ou enviar novamente transações para o serviço ou a uma outra instância do serviço no caso de uma falha do caminho de rede.

A alta disponibilidade é essencial para garantir a operação das suas aplicações sem downtime. Ela é capaz de resolver falhas não previstas. Tecnologias como containers, Kubernetes e serverless apresentam novas oportunidades de desenvolvimento de aplicações, mas ainda precisam de um plano de recuperação para o caso de falhas.

Post do blog The New Stack: Maintaining data resiliency in the age of Kubernetes (em inglês)

A recuperação de desastres (DR) é a capacidade de recuperar e manter aplicações essenciais para os negócios de desastres naturais ou criados pelas pessoas, protegendo a infraestrutura ou as aplicações de uma maneira geograficamente distribuída, para reduzir ao máximo o impacto nos negócios. É a estratégia de continuidade geral dos negócios das grandes organizações, projetada para preservar a continuidade das operações de negócios durante grandes eventos adversos. A meta é viabilizar a recuperação automática ou automatizada em distâncias mais longas do que a alta disponibilidade tradicional, ampliando-a para um cluster diferente. Em ambientes em que a aplicação é restrita a um site por vez, a migração entre sites pode ser automatizada e precisa de uma pessoa com autoridade para tomar a decisão de transferir os serviços entre sites. Isso é necessário quando a tecnologia tem um custo para sincronizar novamente as aplicações em casos de failover entre sites. Reduzir o tempo de recuperação de incidentes é fundamental para o sucesso da sua organização.

A capacidade de DR regional oferece replicação de metadados e dados persistentes ao volume em todos os sites que são geograficamente dispersos. Na nuvem pública, isso seria semelhante à proteção de uma falha regional. A DR regional mantém a continuidade dos negócios durante a indisponibilidade de uma região, aceitando determinadas perdas de dados em uma quantidade previsível. Isso costuma ser expresso como objetivos de ponto de recuperação (RPO) e objetivos de tempo de recuperação (RTO).

O RPO é uma medida da frequência com que você faz backups ou snapshots de dados persistentes. Na prática, o RPO indica a quantidade de dados que serão perdidos ou precisarão ser inseridos novamente após uma interrupção.

O RTO é a quantidade de downtime que uma empresa pode tolerar. O RTO é a resposta à pergunta: "Quanto tempo seu sistema demora para se recuperar após a notificação de uma disrupção dos negócios?"

Confira a documentação sobre como configurar o Red Hat OpenShift Data Foundation para a recuperação de desastres regional com o gerenciamento avançado de clusters.

Artigo da TechRepublic: "Your organization needs regional disaster recovery: Here’s how to build it on Kubernetes"

Post: Recuperação de desastres do Kubernetes agora disponível no OpenShift 4.11

Leia mais sobre backup e recuperação

Nossos parceiros de ecossistema trabalham conosco para validar as soluções com nossas plataformas e viabilizar uma estratégia robusta de proteção de dados e recuperação de desastres. Conheça melhor nossos parceiros de infraestrutura de rede e armazenamento.

O que é alta disponibilidade e recuperação de desastres para containers?

Acesse a biblioteca de conteúdos da Red Hat

Blog da Red Hat

Teste as soluções Red Hat gratuitamente

Leia mais

Red Hat OpenShift para desenvolvedores

O que é o cliente Java do Kubernetes?

Kubernetes na AWS: comparação entre K8s autogerenciado e plataforma de aplicações gerenciada

Containers: conteúdo adicional

Plataformas

Ferramentas

Experimente, compre e venda

Comunicação

Sobre a Red Hat

Selecionar idioma

Red Hat legal and privacy links

Red Hat legal and privacy links