Rapports-Intervention/ri-28-05-situation-degrade-apres-mort-grandours2.md
... ...
@@ -0,0 +1,88 @@
1
+<!-- --- title : RI : 28/05 Passage en situation dégradée suite à la mort de Grandours2 -->
2
+
3
+Dans le week-end du 26 au 27 mai, une coupure électrique globale de l'école, suivie par de nombreuses micro-coupures régulières, à provoqué un bris partiel de l'un de nos switchs de coeur, Grandours-2. Ces coupure ont induit des coupures totales de nos services, puis le bris du switch coeur à induit une dégradation des services définitives sur une partie des bâtiments.
4
+
5
+Une situation de mise en place à été mise en place pour permettre un accès à internet mais pour tout nos utilisateurs.
6
+
7
+
8
+## État :
9
+**Situation dégradé du réseau.**
10
+
11
+Nous sommes en attente d'une solution de remplacement pour Grandours-2.
12
+Le CA du 9 juin aura pour objet de décider sur la suite des évènements pour le ResEl.
13
+
14
+## Date :
15
+26 ou 27 mai, puis réparation et stabilisation durant la semaine jusqu'au 3 juin.
16
+
17
+## Admins impliqués :
18
+
19
+Tout ceux présents
20
+
21
+## But :
22
+
23
+Mettre en place une situation dégradé stable pour les utilisateurs et l'accès à internet.
24
+
25
+## État des lieux avant :
26
+
27
+Grandours 1 et Grandours 2 stackées ensemble.
28
+Brassage sur Grandours :
29
+ - les uplinks de tout les bâtiments
30
+ - le LACP du I11 (4 fibres), l'arrivée secondaire du I7
31
+ - l'arrivée DISI
32
+ - Zahia
33
+ - Kyubey
34
+
35
+## État des lieux après :
36
+
37
+Grandours 1 seule
38
+Brassage sur Grandours :
39
+ - les uplinks des bâtiments I1 à I10, l'uplink de la salle serveur du I11 (une des 4 du LACP)
40
+ - Câble d'interco avec Laperouse
41
+
42
+Brassage sur Laperouse (switch d'arrivée de la fibre d'Adista) :
43
+ - les uplinks du I12 et du foyer
44
+ - l'arrivée DISI
45
+ - Zahia
46
+ - Kyubey
47
+ - Câble d'interco avec Grandours
48
+
49
+Plus de LACP avec le I11, le switch de desserte du I11 est
50
+branchée directement sur le switch Laetitia du I11, l'arrivée
51
+secondaire du I7 est déconnectée, le switch de desserte
52
+secondaire du I7 est branchée directement le switch de desserte
53
+primaire.
54
+
55
+Globalement le fonctionne du réseau est inchangée, cependant
56
+comme il n'y a plus que 12 ports sur Grandours, les ports ont été
57
+déplacés sur Laperouse, le câble d'interco permettant de switcher
58
+vers eux.
59
+
60
+Les vlans nécéssaires et le routage nécéssaire à été défini sur Laperouse.
61
+
62
+
63
+## Machines/Services touchés :
64
+
65
+- Grandours 2, qui est détruite. Elle a été déplacée au I11 en
66
+attente de sortie du parc pour être rendu à la DISI.
67
+
68
+- Laperouse a été reconfigurée.
69
+
70
+## Problèmes rencontrés :
71
+
72
+- Les hyperviseurs ont eu du mal rebootés automatiquement.
73
+
74
+- Lors du déplacement du I12 et du foy sur Laperouse, une problème au niveau du DHCP snooping a causé la perte du service DHCP au I12.
75
+En effet, le dhcp snooping par défaut sur Cisco active l'option 82 dans la trame de la requête, qui provoquait une incompatibilité avec notre serveur.
76
+Cette option a été désactivé.
77
+
78
+
79
+## Tests :
80
+
81
+Connection internet depuis les différents bâtiments fonctionnels
82
+
83
+## Évolutions futures :
84
+
85
+Au CA du 9 juin, des décisions seront prises pour l'évolution de
86
+ce problème. Dans l'idéal, un ou deux nouveaux switchs, soit
87
+donnés, soit achetés, seront disponibles pour remplacer notre
88
+coeur de réseau.