Home » Infraestructura » Alta disponibilitat

Alta disponibilitat

L’objectiu de l’alta disponibilitat és que el servei continuï funcionant tot i que hi hagi avaries greus en qualsevol punt del sistema. Per aconseguir-ho, s’han d’eliminar tots els punts únics de fallada. Són molts els components que poden fallar, a continuació repassarem els més importants.

Fallada en un servidor

Quan un dels servidors pateix una avaria que impedeix el seu funcionament, els serveis que estaven en aquella màquina es reparteixen entre els altres servidors. Això és possible gràcies a la virtualització i a tenir les dades accessibles per xarxa (SAN).

Fallada en un camí de xarxa

Al disposar de dos camins per arribar a les dades, el sistema tolera fallades en qualsevol element de xarxa: targetes de xarxa dels servidors, switchs i controladora de xarxa del SAN. El sistema autodetecta avaries i automàticament passa a fer servir el camí alternatiu.

Fallada en el SAN

El SAN és el component més robust de la nostra infraestructura, però també el més crític, ja que és on totes les dades es troben emmagatzemades. El fet que la probabilitat d’una avaria total sigui molt reduïda (absolutament tot el maquinari està duplicat) no és suficient com per a prescindir de les mesures d’emergència. És per això que hem dotat al servidor de backup dels components necessaris per a poder substituir el SAN a partir de l’ultima còpia de les dades (màxim un dia de decalatge).

Fallada total

Per desgracia totes les mesures esmentades fins ara resulten insuficients en cas de caiguda de les instal·lacions. Per aquest motiu, un cop per setmana realitzem una còpia de totes les dades a un altre datacenter de Barcelona. Això suposa un cost bastant important per a nosaltres però ens permet restablir el servei en qüestió de minuts. És important tenir present que la majoria de proveïdors comercials d’hostatge no ofereixen aquest tipus de servei.

Fallada en el servei de correu

Tenim tres instàncies del servei de correu funcionant de forma simultània. En cas de que alguna d’elles falli, les altres són capaces de seguir mantenint el servei de correu en funcionament sense cap mena d’interrupció.


javgen