La technique de compression de texte qui remplace les mots fréquemment utilisés par un seul caractère est appelé substitution .
Voici comment cela fonctionne:
1. Identifier les mots fréquents: L'algorithme analyse le texte et identifie les mots qui apparaissent le plus fréquemment.
2. attribuer des caractères uniques: Chaque mot fréquent se voit attribuer un seul caractère unique (généralement pas une partie de l'alphabet d'origine).
3. Remplacez les mots: Le texte d'origine est ensuite numérisé et chaque mot fréquent est remplacé par son caractère unique affecté.
4. Stockez la cartographie: La cartographie des caractères en mots est stockée séparément, il peut donc être utilisé pour décompresser le texte plus tard.
Exemple:
Disons que les mots fréquents dans un texte sont "le" "et," "est" et "à".
* mappage:
* "le" -> 'a'
* "et" -> 'b'
* "is" -> 'c'
* "à" -> 'd'
* Texte compressé: "C'est un grand jour B It C Sunny D sort."
Remarque: Cette technique est simple mais souvent pas très efficace pour comprimer de grandes quantités de texte. Il peut être plus efficace lorsqu'il est combiné avec d'autres techniques comme le codage de longueur de course.
|