FASTA est un format basé sur du texte utilisé en bioinformatique pour représenter les séquences , en particulier ceux des nucléotides et des peptides , des paires de bases représentée par une seule lettre. Une séquence FASTA compose d' une description de ligne individuelle , qui se distingue par un "supérieur à" symbole sur la première ligne , suivi par une séquence nucléotidique ou d'un peptide à plusieurs lignes . Vous pouvez extraire plusieurs séquences à partir d'un fichier FASTA en utilisant des modules spéciaux ou des add-ons pour le langage de programmation Perl, connu sous le nom BioPerl , qui ont été spécialement mis au point pour gérer le format FASTA . Vous pouvez également coder manuellement un script Perl pour trouver des éléments dans un fichier ou d'utiliser d'autres outils pour extraire des séquences FASTA . Choses que vous devez
FASTA fichier
Perl éditeur
BioPerl
ActiveState Perl
Biopieces
Afficher plus Instructions
1

Lancez votre Perl demande de l'éditeur. Vous pouvez utiliser un simple éditeur de texte comme Bloc-notes . Vous aurez besoin d'enregistrer le fichier avec une extension ". Pl" pour indiquer qu'il s'agit d'un programme Perl.
2

extraire une séquence à partir d'un fichier de plusieurs FASTA en effectuant pattern-matching en Perl, en tapant le code suivant dans l'éditeur:

# /usr /bin /perlmy fasta_seq $ = shift; my $ sequence = shift; my $ workfile = `cat fasta_seq $` , mon ( fasta_seq $) = ! workfile $ = ~ /(> $ sequence [^ >] +) /s; print $ fasta_seq ;
3

Extrait les séquences du fichier FASTA utilisant BioPerl . Vous pouvez extraire plusieurs séquences en tapant le code suivant dans l'éditeur:

# /bin /perl -w

utilisation Bio :: SeqIO ;

$ sequenceobject = Bio ! :: SeqIO -> new ( -file = > " fasta_file_path " , format => " FASTA ");

Le Bio :: Module SeqIO assure le traitement de la séquence sans faille. Vous pouvez récupérer une seule séquence en utilisant la déclaration suivante:

$ retrievedsequence = $ sequenceobject -> next_seq ;

Vous pouvez parcourir l'objet et récupérer des séquences multiples , comme suit :

while ($ retrievedsequence = $ sequenceobject -> next_seq ) {print $ retrievedsequence -> seq, "\\ n ";}
4

Extrait les séquences du fichier FASTA l'aide de la application " Biopieces ", qui est cadre contenant un ensemble d'outils modulaires de manipulation de données bioinformatiques . Vous exécutez votre commande Biopieces à la ligne de commande

read_fasta -i fasta_file

Article précédent： Comment contraindre n'importe quel fichier en UTF -8 en Perl
Article suivant： Comment faire pour convertir XML en PDF en Perl