FASTA est un format basé sur du texte utilisé en bioinformatique pour représenter les séquences , en particulier ceux des nucléotides et des peptides , des paires de bases représentée par une seule lettre. Une séquence FASTA compose d' une description de ligne individuelle , qui se distingue par un "supérieur à" symbole sur la première ligne , suivi par une séquence nucléotidique ou d'un peptide à plusieurs lignes . Vous pouvez extraire plusieurs séquences à partir d'un fichier FASTA en utilisant des modules spéciaux ou des add-ons pour le langage de programmation Perl, connu sous le nom BioPerl , qui ont été spécialement mis au point pour gérer le format FASTA . Vous pouvez également coder manuellement un script Perl pour trouver des éléments dans un fichier ou d'utiliser d'autres outils pour extraire des séquences FASTA . Choses que vous devez FASTA fichier Perl éditeur BioPerl ActiveState Perl Biopieces Afficher plus Instructions 1 Lancez votre Perl demande de l'éditeur. Vous pouvez utiliser un simple éditeur de texte comme Bloc-notes . Vous aurez besoin d'enregistrer le fichier avec une extension ". Pl" pour indiquer qu'il s'agit d'un programme Perl. 2 extraire une séquence à partir d'un fichier de plusieurs FASTA en effectuant pattern-matching en Perl, en tapant le code suivant dans l'éditeur: # /usr /bin /perlmy fasta_seq $ = shift; my $ sequence = shift; my $ workfile = `cat fasta_seq $` , mon ( fasta_seq $) = ! workfile $ = ~ /(> $ sequence [^ >] +) /s; print $ fasta_seq ; 3 Extrait les séquences du fichier FASTA utilisant BioPerl . Vous pouvez extraire plusieurs séquences en tapant le code suivant dans l'éditeur: # /bin /perl -w utilisation Bio :: SeqIO ; $ sequenceobject = Bio ! :: SeqIO -> new ( -file = > " fasta_file_path " , format => " FASTA "); Le Bio :: Module SeqIO assure le traitement de la séquence sans faille. Vous pouvez récupérer une seule séquence en utilisant la déclaration suivante: $ retrievedsequence = $ sequenceobject -> next_seq ; Vous pouvez parcourir l'objet et récupérer des séquences multiples , comme suit : while ($ retrievedsequence = $ sequenceobject -> next_seq ) {print $ retrievedsequence -> seq, "\\ n ";} 4 Extrait les séquences du fichier FASTA l'aide de la application " Biopieces ", qui est cadre contenant un ensemble d'outils modulaires de manipulation de données bioinformatiques . Vous exécutez votre commande Biopieces à la ligne de commande read_fasta -i fasta_file
|