Jump to Navigation

Πρακτική Άσκηση ##2: Αναζητήσεις σε βάσεις δεδομένων αλληλουχιών

Σκοπός της άσκησης αυτής είναι η εξοικείωση με τη χρήση των εργαλείων αναζήτησης σε βάσεις δεδομένων αλληλουχιών και η αποτίμηση των αποτελεσμάτων των αναζητήσεων.
ΜΕΡΟΣ Α
Στο εργαστήριο προσδιορίσατε την αλληλουχία ενός ανθρώπινου γονιδίου και η μελέτη της αλληλουχίας του υποδικνύει ότι το γονίδιο κωδικοποιεί την παρακάτω αλληλουχία:

>proteinX
MALWMRLLPLLALLALWGPDPAAAFVNQHLAGSHLVEALYLVFGERGFFYTPKTRREAEDLQVGQVELGG
GPGAGSLQPLALEGSLQKRGIVEQGCTSISSLYQLENYCN
1. Χρησιμοποιήστε το διαδικτυακό εργαλείο BLAST ώστε να εντοπίσετε όμοιες πρωτεϊνικές αλληλουχίες στην πρωτεϊνική βάση δεδομένων χωρίς πλεονασμό (Non-redundant), επιλέγοντας:
α. Το μέγιστο δυνατό αριθμό στοιχίσεων (Max target sequences) που μπορείτε
β. επιλέγοντας τιμή κατωφλίου για το e-value (Expect threshold) την τιμή 0.000001
γ. για όλες τις άλλες παραμέτρους χρησιμοποιήστε τις προκαθορισμένες ρυθμίσεις του προγράμματος.
2. Αξιολογήστε τα αποτελέσματα της αναζήτησής σας.
3. Μπορείτε να υποθέσετε ποιός είναι ο βιολογικός ρόλος της άγνωστης πρωτεϊνης;
ΜΕΡΟΣ Β
Η αλληλουχία της ανθρώπινης μυοσίνης είναι αποθηκευμένη στη βάση δεδομένων του NCBI με κωδικό πρόσβασης CAA86293.1.
 
1. Να αναγνωρίσετε τις πληροφορίες που σας παρέχει για τη συγκεκριμένη πρωτείνη (και την αλληλουχία της) η παραπάνω εγγραφή της βάσης δεδομένων.
2. Να σώσετε την αλληλουχία σε ένα αρχείο σε μορφή FASTA.
3. Χρησιμοποιήστε την αλληλουχία αυτή για να εκτελέσετε τον αλγόριθμο CAST. Τι παρατηρείτε; Να σώσετε τη φιλτραρισμένη αλληλουχία σε ένα αρχείο με μορφή FASTA.
4. Να εκτελέσετε τον αλγόριθμο BLAST (όπως στο ΜΕΡΟΣ Α) με δύο διαφορετικούς τρόπους:
α. Με την πραγματική αλληλουχία της μυοσίνης.
β. Με την αλληλουχία της μυοσίνης μετά τη διαδικασία masking από το CAST.
Συγκρίνετε τα αποτελέσματα των δύο αναζητήσεων.
 
Παράδοση εργασιών: Δευτέρα 19/11/2012

Comments

 

>gi|558669|emb|CAA86293.1| Myosin [Homo sapiens]: E-rich region from 844 to 1929 corrected with score 521

 
>gi|558669|emb|CAA86293.1| Myosin [Homo sapiens] MSASSDAEMAVFGERAPYLRKSEKERIEAQNKPFDAKTSVFVAEPKESYVKSTIQSKEGG KVTVKTEGGATLTVREDQVFPMNPPKYDKIEDMAMMTHLHEPGVLYNLKERYAAWMIYTY SGLFCVTVNPYKWLPVYKPEVVAAYRGKKRQEAPPHIFSISDNAYQFMLTDRENQSILIT GESGAGKTVNTKRVIQYFATIAVTGEKKKDESGKMQGTLEDQIISANPLLEAFGNAKTVR NDNSSRFGKFIRIHFGTTGKLASADIETYLLEKSRVTFQLKAERSYHIFYQITSNKKPDL IEMLLITTNPYDYAFVSQGEITVPSIDDQEELMATDSAIDILGFTPEEKVSIYKLTGAVM HYGNMKFKQKQREEQAEPDGTEVADKAAYLQSLNSADLLKALCYPRVKVGNEYVTKGQTV QQVYNAVGALAKAVYEKMFLWMVTRINQQLDTKQPRQYFIGVLDIAGFEIFDFNSLEQLC INFTNEKLQQFFNHHMFVLEQEEYKKEGIEWTFIDFGMDLAACIELIEKPLGIFSILEEE CMFPKATDTSFKNKLYDQHLGKSANFQKPKVVKGKAEAHFSLIHYAGTVDYNITGWLDKN KDPLNDTVVGLYQKSAMKTLASLFSTYASAEADSSAKKGAKKKGSSFQTVSALFRENLNK LMTNLRSTHPHFVRCIIPNETKTPGAMEHELVLHQLRCNGVLEGIRICRKGFPSRILYGD FKQRYKVLNASAIPEGQFIDSKKASEKLLASIDIDHTQYKFGHTKVFFKAGLLGLLEEMR DEKLAQIITRTQAVCRGFLMRVEYQKMLQRREALFCIQYNVRAFMNVKHWPWMKLFFKIK PLLKSAXTXKXMATMKXXFQKTKDXLAKSXAKRKXLXXKMVTLLKXKNDLQLQVQSXADS LADAXXRCXQLIKNKIQLXAKIKXVTXRAXXXXXINAXLTAKKRKLXDXCSXLKKDIDDL XLTLAKVXKXKHATXNKVKNLTXXMAGLDXTIAKLSKXKKALQXTHQQTLDDLQAXXDKV NILTKAKTKLXQQVDDLXGSLXQXKKLRMDLXRAKRKLXGDLKLAQXSTMDMXNDKQQLD XKLXKKXFXISNLISKIXDXQAVXIQLQKKIKXLQARIXXLGXXIXAXRASRAKAXKQRS DLSRXLXXISXRLXXAGGATSAQVXLNKKRXAXFQKLRRDLXXATLQHXAMVAALRKKHA DSMAXLGXQIDNLQRVKQKLXKXKSXLKMXTDDLSSNAXAISKAKGNLXKMCRSLXDQVS XLKTKXXXQQRLINDLTAQRARLQTXAGXYSRQLDXKDALVSQLSRSKQASTQQIXXLKH QLXXXTKAKNALAHALQSSRHDCDLLRXQYXXXQXGKAXLQRALSKANSXVAQWRTKYXT DAIQRTXXLXXAKKKLAQRLQXAXXHVXAVNAKCASLXKTKQRLQNXVXDLMLDVXRSNA ACAALDKKQRNFDKVLSXWKQKYXXTQAXLXASQKXSRSLSTXLFKVKNVYXXSLDQLXT LRRXNKNLQQXISDLTXQIAXGGKQIHXLXKIKKQVXQXKCXIQAALXXAXASLXHXXGK ILRIQLXLNQVKSXVDRKIAXKDXXIDQLKRNHTRVVXTMQSTLDAXIRSRNDALRVKKK MXGDLNXMXIQLNHANRLAAXSLRNYRNTQGILKXTQLHLDDALRGQXDLKXQLAIVXRR ANLLQAXIXXLWATLXQTXRSRKIAXQXLLDASXRVQLLHTQNTSLINTKKKLXNDVSQL QSXVXXVIQXSRNAXXKAKKAITDAAMMAXXLKKXQDTSAHLXRMKKNLXQTVKDLQHRL DXAXQLALKGGKKQIQKLXARVRXLXGXVXNXQKRNAXAVKGLRKHXRRVKXLTYQTXXD RKNVLRLQDLVDKLQAKVKSYKRQAXXAXXQSNANLSKFRKLQHXLXXAXXRAHIAXSQV NKLRVKSRXVHTKISAE



by Dr. Radut.