R\303\251seau/RedondanceFW.md
... ...
@@ -0,0 +1,39 @@
1
+# Politique de redondance
2
+
3
+![Schéma de la tête](/uploads/fw-redundancy.png)
4
+
5
+Double redondance (à Brest) :
6
+- 2 machines pour s'occuper du fw et du routage
7
+- 2 connections : adista & renater
8
+
9
+Simple redondance (à Rennes) :
10
+- 2 connections : quantic & renater
11
+
12
+Le fw se base sur 3 indicateurs pour déterminer d'un changement :
13
+- connectivité interne, le fw vérifie s'il peut accéder à une liste de sites externe (configuré dans /srv/qos/healthchecker/checker.conf)
14
+- connectivité externe, une sonde vérifie si elle peut accéder à une liste de sites externe (
15
+- connectivité admin, le fw teste s'il est coupé ou non du réseau, en pinguant d'autres noeuds (l'autre fw, les sondes, ...)
16
+
17
+Le fw actif teste en permanence toutes les connections disponibles pour savoir s'il est utile de switcher.
18
+
19
+## Services
20
+2 services sont utilisés :
21
+
22
+### Redondance entre les machines
23
+Utilisation de keepalived configuré dans /etc/keepalived/keepalived.conf qui teste l'ip admin et appelle le script `/srv/qos/scripts/node-changed.sh` en cas de modification de la connection (passage en master/backup). Ce dernier up/down les interfaces et les ips partagées entre les machines.
24
+
25
+### Redondance entre les connections
26
+Un magnification service healthchecker est disponible dans /srv/qos/healthchecker/ ce serice check régulièrement des ip externes via les 2 co pour déterminer si elle sont up ou non. En cas de changement de status, la configuration du service reselqos est modifiée en fonction et le service recharger.
27
+
28
+## Politiques
29
+
30
+- Perte de connexion, signalée en interne :
31
+ 1. Si une autre connexion est disponible, on bascule dessus
32
+ 2. Sinon si un autre fw est disponible, on bascule dessus
33
+
34
+- Perte de connexion, signalée par la sonde : (non développé pour l'instant)
35
+ 1. Si la connexion actuelle est vue comme disponible, cela signifie que le problème ne vient pas de la co mais du fw. Si un autre fw est disponible, on bascule alors dessus
36
+ 2. Sinon si une autre connexion est disponible, on bascule dessus
37
+
38
+- Perte de connexion admin (eth0.994) :
39
+ Le fw est vu comme "coupé" du réseau, il va alors se désactiver (i.e. retirer les ips partagées) et attendre d'être reconnecté.
... ...
\ No newline at end of file