La déduplication basée sur le contenu (Content-Defined Chunking ou CDC) est une méthode avancée de déduplication des données qui divise les fichiers en blocs ou morceaux variables, identifiés par leur contenu plutôt que par leur emplacement fixe ou leur taille.
Cette technique analyse le contenu des données pour déterminer les points de découpe optimaux, permettant une identification plus précise et une élimination des doublons à travers un ensemble de données plus large.
La déduplication CDC améliore l’efficacité de la déduplication en adaptant dynamiquement la taille des blocs aux patterns de données, ce qui optimise la transmission des données cers l’espace de sauvegarde et réduit considérablement l’espace de stockage nécessaire pour les sauvegardes.
Cette technique de déduplication est utilisée par la dernière génération de moteur de sauvegarde comme Restic, Borg, ….