Rapports-Intervention/ri-29-04-Maj-san-et-hyperviseurs.md
... ...
@@ -0,0 +1,62 @@
1
+**État :** Hyperviseurs et SAN à jour.
2
+
3
+**Date :** Samedi 29 avril 2017
4
+
5
+**Admins impliqués :** Loïc Carr, Bruno Mateu, Ayoub Boudhar, Paul Dubot, JB Valladeau, Hugo Ludmann
6
+
7
+**But :** Mise à jour du SAN et des hyperviseurs
8
+
9
+**État des lieux avant :** SAN en retard de plusieurs versions (La dernière mise à jour datait de 6 mois), mais aussi pour les hyperviseurs (PVE).
10
+
11
+**État des lieux après :** SAN en retard d'une seule version mineure, Hyperviseurs à jour*.
12
+
13
+**Machines/Services touchés : **Nikita, Camille, Proxima, Sanizator. (Et bien évidemment toutes les VMs)
14
+
15
+Détail des modifications :
16
+
17
+9h30 : Ouverture du local i11 et début des opérations
18
+
19
+- Étape 1 : (Préparatifs)
20
+
21
+- Travaux sur le LDAP secondaire (mise à jour du LDAP de Rennes)
22
+- Extinction de toutes les VM non-critiques sur les 3 hyperviseurs
23
+
24
+- Étape 2 : (mise à jour du SAN)
25
+
26
+-Extinction de toutes les VMs
27
+-Extinction des Hyperviseurs
28
+-Mise à jour du SAN (Une dizaine de minutes, nécessite un redémarrage.)
29
+
30
+- Étape 3 : (Mise à jour des hyperviseurs)
31
+
32
+- Mise en service d'Irulan et de Pegase, puis le container docker du proxy sur Pegase. (Nécessaires à la màj)
33
+- Mise à jour des packets des hyperviseurs.
34
+
35
+- Étape 4 : (Migration des VM sur le Raid 10)
36
+
37
+- Transfert des VMs vers le raid10, des plus critiques aux moins critiques (pour un retour a la normale le plus rapide possible)
38
+- Rallumage progressif des VMs
39
+
40
+- Étape 5 : (Tests)
41
+
42
+- Check des outils admin du ResEl.
43
+- Icinga : interface web renvoie une page blanche. (Problème réglé, #152)
44
+- Check des services utilisateur.
45
+- Test de l'envoi de mail au support.
46
+
47
+16h30 : Fermeture du local i11
48
+
49
+Problèmes rencontrés :
50
+
51
+- Le LDAP de Rennes était désynchronisé, Loïc a du forcer la synchro en supprimant les fichiers du LDAP, mais ça a pris trop de temps, même en prenant un dump du LDAP Brest et en essayant de l'ajouter avec slapdadd, ce qui a provoqué un petit retard sur l'opération.
52
+
53
+- L'authentification RADIUS a été bloquée pour un moment, un changement de LDAP utilisé et un redémarrage a résolu le problème. Il y a eu presque une heure de downtime Wi-Fi.
54
+
55
+Tests :
56
+
57
+- Pas de mails supports après une semaine ?
58
+
59
+Évolutions futures :
60
+
61
+- Une meilleur configuration du LDAP au niveau de la redondance.
62
+- Une meilleur redondance au niveau du RADIUS.
... ...
\ No newline at end of file