Quelques bons principes pour les sauvegardes de données

( mis à jour le 25.10.2019 )

On ne le répétera jamais assez, alors je vais le re-dire : les sauvegardes sont essentielles pour la survie de vos données.

Ce sont elles -et elles seules- qui en garantissent l’intégrité et la disponibilité. Elles doivent être faites régulièrement, testées régulièrement et surveillées régulièrement. Il faut insister sur l’importance de chacune de ces tâches car elles sont toutes indispensables pour que vos sauvegardes soient prêtes le jour où vous en aurez besoin. Notez bien que j’ai sciemment écrit « le jour où vous en aurez besoin » et pas « si vous en avez besoin un jour ».

Ce sont les sauvegardes qui vous permettront de vous remettre sur pied et d’assurer la continuïté de vos activités après un incident. Il pourra s’agir d’un vol de matériel, d’un virus (rançongiciel), d’une panne d’un disque de votre ordinateur, mais aussi peut-être d’une simple erreur de manipulation (effacer tout un répertoire au lieu de juste le renommer comme vous le souhaitiez par exemple).

Ce n’est malheureusement que lorsque on est confronté à une situation d’urgence qu’on réalise à quel point on est mal préparé, mal protégé et qu’on n’aurait pas du remettre à plus tard la dernière sauvegarde ou la mise en place d’une solution automatique.

Les bonnes pratiques pour les sauvegardes sur place

Les sauvegardes doivent être effectuées très régulièrement (je veux bien sûr dire « tous les jours ») et il est important de conserver les versions précédentes (complètes, incrémentales et/ou différentielles) car certains virus (rançongiciel ou non) altèrent vos fichiers petit à petit, opération qui peut prendre plusieurs jours et parfois même plus longtemps encore. Si vous n’avez pas de sauvegarde antérieure à l’infection, vous aurez irrémédiablement perdu des données. Faire une sauvegarde complète chaque jour qui écrase celle de la veille est donc une pratique à éviter!

Si vous avez la possibilité de vous servir d’un NAS (un petit boitier qui fait office de serveur de fichiers sur votre réseau), il faut alors effectuer vos sauvegardes en utilisant soit FTP soit n’importe quel autre protocole spécifique qui ne soit pas un simple partage de fichiers habituel. Evitez définitivement les disques réseau via SMB (smb://serveur/dossier) ou AFP (afp://serveur/dossier). En cas d’infection, tous les disques partagés sur votre réseau seront probablement contaminés. Et si vos sauvegardes s’y trouvent, vous ne pourrez pas les utiliser pour récupérer vos données !! Isoler vos sauvegardes sur un système qui ne partage pas ses répertoires sur votre réseau est indispensable.

Incrémentales ou différentielles, c’est quoi ?

Les deux variantes partent d’une sauvegarde complète initiale.

La sauvegarde « incrémentale » n’enregistre que les changements qui ont eu lieu depuis la sauvegarde précédente (qu’il s’agisse de la première complète ou de l’incrémentale de la veille). Les avantages immédiats sont qu’elle reste de très petite taille (seuls les éléments qui ont été modifiés sont sauvegardés) et qu’elle est donc très rapide. Le défaut est que si l’une des versions incrémentales est corrompue et ne peut pas être utilisée, vous perdrez des données car la remise en état d’un système demande la récupération de la sauvegarde complète initiale puis de toutes les versions incrémentales suivantes. Et si l’un des fichiers est inutilisable, la chaîne est compromise.

La version « différentielle » occupe un peu plus de place et est un peu moins rapide car elle enregistre chaque jour tout ce qui a été modifié depuis la dernière sauvegarde complète. Si vous effectuez la copie initiale lundi, la sauvegarde de mardi contiendra les modifications qui ont eu lieu depuis lundi. La sauvegarde de mercredi enregistrera à son tour tous les changements qui ont eu lieu depuis lundi (y compris ceux de mardi qui sont déjà dans la version précédente). Et au fil des jours qui passent, la version quotidienne devient plus volumineuse, jusqu’à la prochaine copie complète qui permet de redémarrer un cycle. Le gain de sécurité et de fiabilité qu’apporte la technique « différentielle » par rapport à la version « incrémentale » est important car chaque version différentielle est indépendante, avec chaque fois une vision complète des données depuis la dernière sauvegarde. En cas de besoin, vous n’avez pas besoin d’avoir une chaîne complète intègre : il vous suffit de restaurer la version initiale et l’une des versions différentielles pour remonter au jour souhaité. (edit: 18:54, j’ai inversé les définitions des deux variantes, merci @darxmurf pour ta vigilance)

Est-ce qu’il faut vraiment tester les sauvegardes régulièrement ?

Si le processus de récupération des données n’est pas testé et vérifié, il est fort probable que vous aurez de désagréables surprises le jour où vous en aurez besoin (bis repetita placent). Entre la sauvegarde qui n’a pas enregistré exactement tout ce qu’on avait à l’esprit (répertoire précis exclu), les erreurs de configuration (droits d’accès aux dossiers, filtres sur les documents à ne pas enregistrer) sans oublier les données correctement enregistrées mais qui ne seront pas utilisables (état des machines virtuelles notamment, VMWare ou Parallels), les pièges sont très nombreux. Et la seule façon de les éviter est effectivement de restaurer une sauvegarde complète sur un espace prévu pour cela, en parallèle de vos « vraies » données. Et de comparer les deux !

La plupart des logiciels spécialisés offrent des fonctions de vérification de cohérence et de disponibilité des données qu’ils ont enregistrées et ça permet d’espacer les tests de récupération manuels qui restent néanmoins nécessaires.

Des sauvegardes à l’extérieur, est-ce que c’est vraiment utile/nécessaire ?

La sauvegarde auprès d’un tiers externe offre la seule garantie concrète contre le vol ou les dégats de votre matériel informatique. Si vous faites vos sauvegardes sur un serveur de fichier dans votre bureau et que celui-ci est endommagé ou subtilisé, vos sauvegardes disparaîtront avec le matériel. Si vous utilisez des disques externes USB que vous stockez en dehors de vos locaux (ou dans un coffre par exemple), les contraintes de disponibilité que cela entraîne nuiront très certainement à la régularité de vos sauvegardes, et ce n’est pas le but recherché.

La sauvegarde externe est effectuée automatiquement auprès d’un prestataire spécialisé et de confiance. Elles sont la plupart du temps faites via le protocole FTP et cela apporte le gain de sécurité supplémentaire que nous évoquions plus haut. Les données que vous sauvegardez à l’extérieur doivent être chiffrées afin que vous seuls puissiez les lire, et la plupart des logiciels modernes s’en chargent facilement.

Soyez particulièrement vigilant avec l’endroit où elles sont stockées, qui peut y avoir accès et de quelle façon elles sont elles-mêmes sauvegardées par le prestataire