Les emmerdes ça vole en escadrille

Le disque dur principal de mon proxmox a grillé. C'est la loose !

Les emmerdes ça vole en escadrille

Bonjour,

Bon depuis le début de la semaine, le site a bien merdouillé ! Tout à commencé Dimanche soir, je vais pour faire une sauvegarde (une envie comme ça) de la VM du site et je m’aperçois que c’est d’une lenteur effarante. Ca me prend normalement quelques minutes, celle-ci aura duré au final quasi 2h30 !!! Et quand je fais des sauvegardes, la VM se met en pause et le site n’est plus accessible. Bon, je n’ai pas envie de m’éterniser sur le problème surtout que je ne trouve rien sur le sujet sur internet.

Deuxième épisode Lundi soir. Je me dis bon, maintenant après la sauvegarde, essaye de faire un snapshot. Les snapshots, c’est l’un des features magique de proxmox : il permet de prendre en quelques secondes un instantané de la VM et si on fait des erreurs, hop, un petit rollback sur cette image qui se fait tout aussi rapidement. C’est absolument extraordinaire, ça me permet de tester plein de trucs sur mes VMs en toute sécurité. Le premier snapshot se fait sans problème et le deuxième bing, timeout erreur ! Euhhh, wtf ? Je ne trouve rien là-dessus sur le net. Humm. En grattant un peu, je m’aperçois qu’il trouve des erreurs dans une VM sur des blocks. Des erreurs sur la partie virtualisée du disque dur ? Euhhh. Je réinstalle une sauvegarde qui datait d’il y a quelques jours de la VM et ça semble refonctionner (même si la sauvegarde a été encore d’une lenteur de dingue). Je commence à soupçonner un problème avec le disque dur mais comme il s’agit de mon SSD le plus récent et que le test SMART de la semaine précédente était OK, il n’y a rien de tangible.

Troisième épisode Mardi soir. Je n’arrive plus à faire de Snapshots. Ahhhhhhhhhhhhhhhhhhhh ! Pas bien ! Je regarde dans les consoles des VMs et je m’aperçois que j’ai des erreurs dans toutes les VMs. Au bout de quelques minutes je vais vérifier les données qui sont dans mon stockage et je m’aperçois que le fichier ou est stocké chaque VM a disparu. OMFG !!!! Plus rien ! Ahhhhhhhh ! Bon bah là c’est clair au moins c’est mon disque qui est mort. A noter que ce disque qui date de 2014 n’avais quasi jamais tourné lorsqu’il était sur mon PC (il me servait à faire des tests) et qu’il aura fonctionné au total moins de 2ans. J’avais regardé le SMART test la semaine d’avant et il avait moins de 13000h au compteur (soit 1.5 an). C’était un SANDISK. Première et dernière fois que j’achète cette marque, ce n’était effectivement pas cher mais si c’est pour mourir comme une merde aussi vite, super… A noter que proxmox est lui installé sur un Intel qui date de 2014 et qui tourne non-stop depuis 5 ans (c’est mon ancien disque principal de mon PC).

Dernier épisode Mercredi soir. Nouveau SSD reçu dans la boite aux lettres en moins de 24h, les transports ce n’est pas bon pour la planète mais j’apprécie ! Je dois vous avouer que je ne savais pas du tout comment ça allait se passer car je n’avais jamais réinstallé Proxmox depuis ma toute première installation il y a deux ans et j’avais peur de tout perdre. J’ai des sauvegardes mais si il faut réinstaller et reconfigurer tous les programmes, ça aurait été long, pénible et lourd. Heureusement pour moi, le génie que je suis avais trouvé le moyen de sauvegarder ses VMs sur un support externe (mon PC pour tout vous dire) il y a quelques jours ! Je vous passe les deux heures que j’ai perdu parcequ’à ce moment-là mon génie était en berne car j’ai inversé le cable LAN & WAN et que je n’arrivais pas à pinger ma machine et à faire le changement d’IP pour ma box (elle n’est pas dans le range d’IP de mon réseau local donc comme j’ai oublié de la modifier avant de tout couper bah après je n’avais plus accès à rien, genius inside je vous dit). Une fois les neurones connectés, l’installation de Proxmox c’est 5min montre en main et la réinstallation des sauvegardes depuis le support externe quelques minutes et retour online comme si de rien n’était ! La par contre c’est impressionnant. C’est la première fois que je réinstalle un système complet et que je réutilise des backups et que ça se passe sans la moindre anicroche. Ca me rassure vraiment sur la pérennité de cette solution !

Donc en résumé tout refonctionne (et ça devrait être un micro-poil plus rapide, peut être pas pour vous mais pour moi au niveau des sauvegardes car le nouveau SSD est plus performant), je suis de retour online et content ! Voila pour mes dernières péripéties,

@+