Nous l’utilisons quotidiennement, elle fait son travail mais finalement qu’est-ce que la compression ?

Cet article sera le premier d’une série de 3 parties :

Cette série d’articles a pour but de vulgariser le sujet de façon simple et accessible. La 3ème partie sera une mise en application pratique pour votre vie numérique de tous les jours.

C’est parti ! …

 

I – Qu’est-ce que la compression de données ?

A – Le principe

Derrière sa complexité mathématique et technique, son principe élémentaire est relativement simple…

 Convertir via un algorithme sous une forme réduite des données tout en étant capable de pouvoir la restituer parfaitement (lossless) ou partiellement (lossy) selon l’application recherchée.

B – Zip, mais pas que !

La compression n’est pas uniquement présente que dans vos fichiers zip, elle est présente partout sans vous en rendre compte…

  • Protocoles informatiques d’échange de données : (réseau local / internet, satellite, etc..)
  • les fichiers multimédia vidéo : avi, mov, mp4, flv, mkv, …
  • les fichiers multimédia audio : mp3, aac, flac, …
  • les fichiers multimédia image : jpg, png, gif, …

Avec des fichiers qui deviennent de plus en plus nombreux et volumineux, son enjeu est crucial pour le stockage et le partage de données.

 B – Les types de compression

Nous pouvons dissocier 2 types de compression :

  • Le “lossy” dit “avec perte / destructif”, utile pour restituer un résultat avoisinant pour un usage précis.
    • Exemple 1 : Le format mp3 pour la musique est une version compressée non identique à l’original mais parfaitement audible.
    • Exemple 2 : Vous avez une image de 6 Mb provenant de votre APN (appareil photo numérique) afin de pouvoir l’envoyer sur Facebook, vous pouvez compresser davantage votre photo en jpg pour réduire sa taille au détriment de sa qualité.
  • Le “lossless” dit “sans perte / non destructif”, utile pour restituer à l’identique des fichiers numériques pour ordinateur.
    • Exemple 1 : 3 fichiers Word sont compressés dans un fichier zip; lors de la décompression nous devons avoir exactement les mêmes fichiers avant leur compression, sans quoi vos documents Word ne pourront pas être lus, ils seront alors dit “corrompus”.
    • Exemple 2 : A l’opposé du mp3, il est possible grâce à la compression Flac (audio sans perte) d’obtenir une musique sans perte de qualité, certes plus lourd que le mp3 mais beaucoup moins que l’original.

II – Comment ça marche? (version très simplifiée)

Afin de mieux comprendre comment tout cela fonctionne, prenons l’exemple d’une compression de fichiers sans perte :

Cet exemple est une présentation d’un algorithme très simple : RLE (codage par répétition)

Imaginons un fichier texte dont son contenu contient :  orangeorangeorangeorangebananebanane.

Le fichier compressé ne contiendra plus que 4orange2banane.

Nous avons donc utilisé ici une méthode de “compression” qui réduit sa taille en repérant les modèles qui se répètent.

Pour retrouver l’original “décompression”, il suffira de le re-assembler.

La compression dans la pratique se fait avec des algorithmes encore plus complexes.

Afin de pouvoir encore plus réduire sa taille, optimiser le temps nécessaire pour compresser / décompresser, etc.

 

III – Comment ça marche? (allez plus loins…)

Pour votre savoir personnel, ces algorithmes sont classés en 4 types de codage :

Pour les images, nous pouvons citer également les techniques de Sous-échantillonnage de la chrominance et de la Quantification de signal.

Pour le son, il s’agit des divers algorithmes précédemment évoqués afin de traiter les fréquences (le plus souvent, le codage de Huffman). On peut citer l’utilisation d’une Transformation de Fourier rapide afin de pouvoir diviser le nombre d’opérations nécessaires pour parvenir au résultat.

Si vous souhaitez en savoir plus, vous pouvez cliquer sur les liens cliquables ci-dessus (wikipédia).

 

Prêt pour la partie 2 “Mieux comprendre les deux principales familles de compression” ? La suite dès demain ! A très bientôt !

Crédits Photo : DRs Kulturarvsprojekt