Python est un langage de programmation orienté objet open-source optimisé pour la création d'applications Web dynamiques. Lors de la programmation en Python, vous devrez peut-être séparer formatage HTML à partir du code Python. Par exemple, un utilisateur peut entrer dans une page Web dans un champ de données , vous obligeant à dépouiller les balises HTML pour stocker les données textuelles. Pour supprimer les balises HTML dans une chaîne , utilisez le module intégré d'expression régulière Python , " regex". Instructions 1 Ouvrez votre éditeur Python . 2 Chargez le module expression régulière en tapant la commande suivante : import re 3 définir une fonction pour supprimer toutes les balises HTML . Par exemple, tapez la commande suivante : def delete_html (données) : 4 séparer les éléments de code HTML en utilisant la fonction " re.compile " pour compiler les modèles d'expressions régulières dans un objet que vous pouvez utiliser comme modèle de comparaison . Reprenons l'exemple , tapez ceci: htmlPattern = re.compile (r ' < . ? * >' ) Dans cet exemple, l'attribut " re.compile " raconte Python à rechercher la chaîne « <.. >" qui signifie le début et la fin des balises HTML. le qualificatif " . * ? " raconte Python pour correspondre uniquement les tags. Sans le qualificatif , Python retourne la chaîne " subhead "; avec le qualificatif , les rendements Python " . Et " 5 Remplacer un espace pour tout le code HTML en utilisant la fonction "sub" . Reprenons l'exemple , tapez la commande suivante : retour htmlPattern.sub ('' , data) Dans ce cas, Python bandes sur le code HTML et le remplace par un espace vide. À ce stade, selon la façon dont vous souhaitez structurer les données , vous pouvez utiliser la fonction " strip" de la chaîne à supprimer les espaces vides ou utiliser des expressions régulières , comme "\\ s + " pour supprimer les espaces supplémentaires . < Br >
|