Voici, ci-dessous, quelques caractéristiques principales de Borg :
Stockage économe en espace
La déduplication est un processus qui élimine les copies excessives de données et réduit considérablement les besoins en capacité de stockage. Elle peut être exécutée à la volée pendant l'écriture des données dans le système de stockage et/ou en arrière-plan pour éliminer les doublons après l'écriture des données sur le disque. Elle a un impact minime sur la performance, car elle s'exécute dans un domaine d'efficacité dédié qui est séparé du domaine de lecture/écriture client. Elle s'exécute en arrière-plan, indépendamment de l'application en cours ou de la façon dont on accède aux données (NAS ou SAN).
Les gains de la déduplication sont conservés lorsque les données sont déplacées : lorsqu'elles sont répliquées sur un site de reprise, sauvegardées dans un espace sécurisé ou déplacées entre les installations sur site, un cloud hybride et/ou un cloud public.
La déduplication basée sur le découpage en blocs défini par le contenu est utilisée pour réduire le nombre d'octets stockés : chaque fichier est divisé en un certain nombre de blocs de longueur variable et seuls les blocs qui n'ont jamais été vus auparavant sont ajoutés au référentiel.
Un bloc est considéré comme dupliqué si sa valeur id_hash est identique. Une fonction de hachage ou MAC cryptographiquement forte est utilisée comme id_hash, par exemple (hmac-)sha256. Pour dédupliquer, tous les blocs du même référentiel sont pris en compte, qu'ils proviennent de machines différentes, de sauvegardes précédentes, de la même sauvegarde ou même d'un seul et même fichier. Par rapport à d'autres approches de déduplication, cette méthode ne dépend PAS de :
- les noms de fichiers/répertoires restent les mêmes : il est donc possible de déplacer votre matériel sans tuer la déduplication, même entre des machines partageant un dépôt ;
- Les fichiers complets ou les horodatages restent les mêmes : si un gros fichier change un peu, seuls quelques nouveaux blocs doivent être stockés - c'est important pour les machines virtuelles ou les disques bruts ;
- La position absolue d'un fragment de données dans un fichier : les données peuvent être déplacées et seront toujours trouvées par l'algorithme de déduplication.
Sauvegardes hors site
Borg peut stocker des données sur n'importe quel hôte distant accessible par SSH. Si Borg est installé sur l'hôte distant, des gains de performance importants peuvent être obtenus par rapport à l'utilisation d'un système de fichiers réseau (sshfs, nfs, ...).
Sauvegardes montables comme des systèmes de fichiers
Les archives de sauvegarde peuvent être montées comme des systèmes de fichiers en espace utilisateur pour un examen interactif facile des sauvegardes et des restaurations (par exemple en utilisant un gestionnaire de fichiers ordinaire).
Vitesse
- le code critique pour les performances (découpage, compression, chiffrement) est implémenté en C/Cython ;
- mise en cache locale des données d'indexation des fichiers/chunks ;
- détection rapide des fichiers non modifiés.
Chiffrement des données
Toutes les données peuvent être protégées à l'aide du chiffrement AES 256 bits, l'intégrité et l'authenticité des données sont vérifiées à l'aide de HMAC-SHA256. Les données sont chiffrées côté client.
Obfuscation
En option, borg peut activement obscurcir, par exemple, la taille des fichiers ou des blocs pour rendre les attaques par empreinte digitale plus difficiles.
Compression
Toutes les données peuvent être compressées de manière optionnelle :
- lz4 (super rapide, faible compression) ;
- zstd (large éventail allant d'une vitesse élevée et d'une faible compression à une compression élevée et une vitesse moindre) ;
- zlib (vitesse et compression moyennes) ;
- lzma (faible vitesse, forte compression).
Installation
L’équipe en charge propose des binaires monofichiers qui ne nécessitent aucune installation – Ils peuvent être simplement exécutés sur ces plateformes :
- Linux
- Mac OS X
- FreeBSD
- OpenBSD et NetBSD (pas encore de support xattrs/ACLs ou de binaires)
- Cygwin (expérimental, pas encore de binaires)
- Sous-système Linux de Windows 10 (expérimental)
Restic ou Kopia pour une approche similaire, mais sous la forme d'un seul binaire compilé
Restic
Restic est un programme de sauvegarde qui est rapide, efficace et sûr. Il prend en charge les trois principaux systèmes d'exploitation (Linux, macOS, Windows) et quelques systèmes plus petits (FreeBSD, OpenBSD). Il a été conçu avec les principes suivants à l'esprit. La sauvegarde des données avec Restic ne peut être limitée que par la bande passante du réseau ou de du disque dur.
La restauration des sauvegardes ne doit transférer que les données nécessaires aux fichiers à restaurer, afin que ce processus soit également rapide. Restic permet de vérifier facilement que toutes les données peuvent être restaurées.
Kopia
Kopia est un outil de sauvegarde/restauration également open source rapide et sécurisé. Il permet de créer des sauvegardes chiffrées des données sur un stockage distant dans le cloud, sur un serveur connecté au réseau, ou localement sur une machine. Kopia ne crée pas d'image de la machine entière. Il permet plutôt de sauvegarder/restaurer tous les fichiers/répertoires jugé importants ou critiques. Avec Kopia, l’utilisateur a le contrôle total de l'endroit où stocker ses données.
Kopia dispose à la fois d'une version CLI (interface de ligne de commande) et d'une version GUI (interface utilisateur graphique), ce qui en fait un outil idéal pour les utilisateurs avancés et pour les utilisateurs réguliers. Le chiffrement fait partie intégrante de l'ADN de Kopia, et il n’est pas possible de créer une sauvegarde sans utiliser le chiffrement. Kopia permet de choisir entre deux algorithmes de chiffrement de pointe, AES-256 et ChaCha20. Kopia chiffre à la fois le contenu et les noms des fichiers ou répertoires sauvegardés.
Les données sont chiffrées à l'aide des clés qui sont dérivées de la clé principale de 256 bits stockée dans le référentiel. La clé principale est chiffrée à l'aide du mot de passe. Cela signifie que quiconque ne connaît pas le mot de passe ne peut pas accéder aux fichiers sauvegardés et ne saura pas quels fichiers ou répertoires sont contenus dans les éléments enregistrés dans le référentiel.
Kopia fournit aux sauvegardes un chiffrement de bout en bout "zero knowledge". « Vous ne pouvez pas restaurer vos fichiers si vous oubliez votre mot de passe : il n'y a aucun moyen de récupérer un mot de passe oublié car vous êtes le seul à le connaître. (Mais vous pouvez changer votre mot de passe si vous êtes toujours connecté au référentiel qui stocke vos instantanés) », indiquent les responsables de Kopia.
Source : Borg
Et vous ?
Quel est votre avis sur le sujet ?
Quels outils ou technique de sauvegarde utilisez-vous ?
Que pensez-vous de BorgBackup ?
Voir aussi :
81 % des entreprises ont connu un incident de sécurité lié au cloud au cours des 12 derniers mois, dont 45 % ont subi au moins quatre incidents, selon Venafi
Les entreprises modifient leur approche de la sauvegarde pour faire face aux risques liés au cloud, 98 % d'entre elles ont désormais recours aux infrastructures BaaS et DRaaS pour protéger les données