Le type de compression qui remplace les caractères spéciaux des motifs de répétition est appelé codage de longueur de course (RLE) .
Voici comment cela fonctionne:
* Identifier les séquences répétitives: RLE scanne les données à la recherche d'occurrences consécutives du même caractère (ou modèle).
* remplacer par un code: La séquence répétitive est ensuite remplacée par un code contenant:
* Le personnage lui-même.
* Le nombre de fois qu'il répète.
Exemple:
Texte d'origine:"aaabbbcccddde"
RLE Texte codé:"3A3B4C3D1E"
Avantages de RLE:
* Simple à implémenter.
* Efficace pour les données avec de nombreux modèles répétitifs, comme les images, les transmissions de fax ou les fichiers texte.
Inconvénients de RLE:
* Pas très efficace pour les données avec peu de répétitions.
* Peut réellement augmenter la taille des données avec beaucoup de hasard.
Autres techniques de compression qui pourraient être intéressées:
* codage de Huffman: Utilise des codes de longueur variable basés sur la fréquence des caractères.
* algorithmes lempel-ziv (lz): Trouve des modèles répétitifs et les remplace par des codes plus courts, généralement en utilisant un dictionnaire.
* codage arithmétique: Représente les données comme une seule fraction, en utilisant des probabilités pour atteindre des ratios de compression plus élevés.
|