987028ed716d8e7b4a5595be8279df0f5332c1e6
Rapports-Intervention/ri-29-04-Maj-san-et-hyperviseurs.md
... | ... | @@ -0,0 +1,62 @@ |
1 | +**État :** Hyperviseurs et SAN à jour. |
|
2 | + |
|
3 | +**Date :** Samedi 29 avril 2017 |
|
4 | + |
|
5 | +**Admins impliqués :** Loïc Carr, Bruno Mateu, Ayoub Boudhar, Paul Dubot, JB Valladeau, Hugo Ludmann |
|
6 | + |
|
7 | +**But :** Mise à jour du SAN et des hyperviseurs |
|
8 | + |
|
9 | +**État des lieux avant :** SAN en retard de plusieurs versions (La dernière mise à jour datait de 6 mois), mais aussi pour les hyperviseurs (PVE). |
|
10 | + |
|
11 | +**État des lieux après :** SAN en retard d'une seule version mineure, Hyperviseurs à jour*. |
|
12 | + |
|
13 | +**Machines/Services touchés : **Nikita, Camille, Proxima, Sanizator. (Et bien évidemment toutes les VMs) |
|
14 | + |
|
15 | +Détail des modifications : |
|
16 | + |
|
17 | +9h30 : Ouverture du local i11 et début des opérations |
|
18 | + |
|
19 | +- Étape 1 : (Préparatifs) |
|
20 | + |
|
21 | +- Travaux sur le LDAP secondaire (mise à jour du LDAP de Rennes) |
|
22 | +- Extinction de toutes les VM non-critiques sur les 3 hyperviseurs |
|
23 | + |
|
24 | +- Étape 2 : (mise à jour du SAN) |
|
25 | + |
|
26 | +-Extinction de toutes les VMs |
|
27 | +-Extinction des Hyperviseurs |
|
28 | +-Mise à jour du SAN (Une dizaine de minutes, nécessite un redémarrage.) |
|
29 | + |
|
30 | +- Étape 3 : (Mise à jour des hyperviseurs) |
|
31 | + |
|
32 | +- Mise en service d'Irulan et de Pegase, puis le container docker du proxy sur Pegase. (Nécessaires à la màj) |
|
33 | +- Mise à jour des packets des hyperviseurs. |
|
34 | + |
|
35 | +- Étape 4 : (Migration des VM sur le Raid 10) |
|
36 | + |
|
37 | +- Transfert des VMs vers le raid10, des plus critiques aux moins critiques (pour un retour a la normale le plus rapide possible) |
|
38 | +- Rallumage progressif des VMs |
|
39 | + |
|
40 | +- Étape 5 : (Tests) |
|
41 | + |
|
42 | +- Check des outils admin du ResEl. |
|
43 | +- Icinga : interface web renvoie une page blanche. (Problème réglé, #152) |
|
44 | +- Check des services utilisateur. |
|
45 | +- Test de l'envoi de mail au support. |
|
46 | + |
|
47 | +16h30 : Fermeture du local i11 |
|
48 | + |
|
49 | +Problèmes rencontrés : |
|
50 | + |
|
51 | +- Le LDAP de Rennes était désynchronisé, Loïc a du forcer la synchro en supprimant les fichiers du LDAP, mais ça a pris trop de temps, même en prenant un dump du LDAP Brest et en essayant de l'ajouter avec slapdadd, ce qui a provoqué un petit retard sur l'opération. |
|
52 | + |
|
53 | +- L'authentification RADIUS a été bloquée pour un moment, un changement de LDAP utilisé et un redémarrage a résolu le problème. Il y a eu presque une heure de downtime Wi-Fi. |
|
54 | + |
|
55 | +Tests : |
|
56 | + |
|
57 | +- Pas de mails supports après une semaine ? |
|
58 | + |
|
59 | +Évolutions futures : |
|
60 | + |
|
61 | +- Une meilleur configuration du LDAP au niveau de la redondance. |
|
62 | +- Une meilleur redondance au niveau du RADIUS. |
|
... | ... | \ No newline at end of file |