Le format de fichier FASTA est utilisé pour stocker les données de séquence d'acides nucléiques ou de peptides . Plusieurs séquences peuvent être stockés dans un seul fichier, appelé fichier multi- FASTA . Les données de séquences est formatée en tant que ligne de court -tête d'identification de la séquence et les données de séquence suivant une nouvelle ligne. En plaçant les en-têtes de séquence dans un fichier multi- FASTA de commandes Perl , il est possible d'extraire les séquences individuelles à partir d'un fichier multi- FASTA . Instructions
1

Ouvrez un éditeur de texte avec un fichier texte vierge pour commencer un nouveau programme Perl.
2

commencer le programme en spécifiant l'emplacement de Perl sur votre système. C'est normalement "/usr /bin /perl " ou "/usr /local /bin /perl . "

#! /Usr /bin /perl
3

Importer le "strict " et " File :: baseName « bibliothèques . Le ":: Basename fichier " bibliothèque prend en charge l'analyse des chemins de fichiers et les extensions . La bibliothèque "strict" restreint constructions peu sûres , jetant une erreur lors de la compilation plutôt qu'à l'exécution.

Utiliser le fichier de strictuse :: Basename
4

lire la variable d'arguments de ligne de commande . Votre programme , si vous choisissez de le nommer " fasta_extract.pl , " va attendre d'avoir l' emplacement d'un fichier et les paramètres FASTA de choisir des séquences à extraire. Le premier paramètre sera le nom du fichier FASTA et la seconde sera une chaîne de pattern matching . Argument variable sont accessibles à partir du tableau "$ ARGV "

mon fasta_file $ = $ ARGV [0]; . My $ pattern = $ argv [1] ;
5

ouverte le fichier FASTA en utilisant la fonction " open () " . Vous pourrez spécifier le programme à quitter si elle ne peut pas ouvrir le fichier en utilisant la commande " die"

ouvert (INPUT , fasta_file $ )

Article précédent： Qu'est -ce que SQL Scripts Perl faire
Article suivant： Comment tester un script CGI Sendmail