Garantisci l'operatività delle applicazioni principali
Quando si trasferiscono i sistemi in un ambiente cloud ibrido, la resilienza è una delle preoccupazioni principali. Infatti la capacità di far fronte a errori e malfunzionamenti senza perdita di dati è essenziale per fornire servizi applicativi affidabili che contribuiscono alla continuità operativa.
Le organizzazioni moderne devono assicurare il funzionamento ottimale delle applicazioni principali anche quando si verifica un problema con uno dei componenti. Per garantire resilienza e prestazioni ottimali anche in caso di guasti intervenire a livello delle applicazioni però non basta, occorre operare a livello dell'infrastruttura dei servizi di dati.
Crea una piattaforma ad alta disponibilità
L'alta disponibilità consiste nel proteggere l'infrastruttura e le applicazioni in un unico sito allo scopo di garantire l'operatività continua. L'obiettivo è ridurre i singoli punti di vulnerabilità nello stack informatico grazie ad accorgimenti quali la creazione di percorsi di accesso ridondanti e la resilienza dei componenti. Introdurre l'alta disponibilità in un ambiente significa avere servizi che dispongono della resilienza integrata e sono in grado di eseguire autonomamente le procedure di ripristino. Le opzioni di ripristino dei servizi includono: riavvio del servizio in caso di suo malfunzionamento; riavvio di un nodo in caso di malfunzionamento dello stesso; ridistribuzione di un carico di lavoro da un hardware non funzionante a una nuova posizione nell'ambiente; la possibilità di ripetere l'invio delle transazioni a un servizio o a una diversa istanza del servizio in caso di malfunzionamento del percorso di rete.
L'alta disponibilità è un aspetto chiave per garantire che le applicazioni non riscontrino tempi di fermo e che siano in grado di far fronte a malfunzionamenti inaspettati. Le tecnologie quali container, Kubernetes e serverless offrono nuove opportunità per lo sviluppo applicativo ed è importante integrarle con un piano di ripristino adeguato.
Risorse da Red Hat
Supera gli obiettivi di ripristino tradizionali
Il ripristino di emergenza è la strategia adottata dalla maggior parte delle organizzazioni leader e consiste nel proteggere l'infrastruttura e le applicazioni secondo una distribuzione su zone geografiche. L'obiettivo è garantire l'operatività continua delle applicazioni business critical e ridurre al minimo l'impatto sulle attività aziendali di guasti dovuti a calamità naturali o all'intervento umano. Rispetto all'alta disponibilità tradizionale, questo approccio aumenta la portata del ripristino automatico o automatizzato consentendone l'esecuzione tra cluster diversi. Negli ambienti in cui le applicazioni sono circoscritte a un singolo sito, è comunque possibile automatizzare la migrazione tra siti ma è necessario che una persona abilitata prenda la decisione di spostare i servizi informatici, in particolare quando la tecnologia prevede un costo per la risincronizzazione delle applicazioni in caso di failover tra siti. Ciò si rende necessario quando la tecnologia prevede un costo per la risincronizzazione delle applicazioni in caso di failover tra siti.Tutto questo richiede tempo e quando si parla di ripristino dell'operatività in seguito a malfunzionamenti la velocità è essenziale per il successo di qualunque organizzazione.
Il ripristino di emergenza regionale, che nel cloud pubblico corrisponderebbe alla protezione dai guasti regionali, prevede la replica dei metadati e dei dati con volume permanente in siti dislocati in aree geografiche diverse. Garantisce la continuità operativa in caso di indisponibilità di una regione e prevede un certo grado di tolleranza per quanto riguarda la perdita di dati. I due parametri usati per descrivere la tolleranza ai guasti di un sistema informatico sono il recovery point objective (RPO) e il recovery time objective (RTO).
L'RPO misura la frequenza con cui l'organizzazione esegue backup e snapshot dei dati permanenti. In sostanza è lo strumento che stabilisce la quantità di dati che andranno persi e si dovranno inserire nuovamente in seguito a un guasto.
L'RTO è l'indisponibilità massima che l'azienda può tollerare. Stabilisce il tempo necessario per il pieno recupero dell'operatività di un sistema dal momento in cui l'azienda viene a conoscenza dell'interruzione del servizio.
Consulta la documentazione sulla configurazione di Red Hat OpenShift Data Foundation per il ripristino di emergenza regionale con Advanced Cluster Management.
Partner
Collaboriamo con il nostro ecosistema di partner per garantire la compatibilità delle loro soluzioni con le nostre piattaforme e mettere a disposizione una strategia efficace per il ripristino di emergenza e la protezione dei dati. Scopri di più sui nostri partner che si occupano di fornire soluzioni per l'infrastruttura di rete e storage.
Il blog ufficiale di Red Hat
Leggi gli articoli del blog di Red Hat per scoprire novità e consigli utili sulle nostre tecnologie, e avere aggiornamenti sul nostro ecosistema di clienti, partner e community.