| | |||||||
| Register | Search | Today's Posts | Mark Forums Read |
| Forum Biologie Forum Biologie. Germany German Biology Forums. |
| | LinkBack | Thread Tools | Display Modes |
|
#1
| |||
| |||
| ....oder, wie man multiple sequence alignments zweckentfremdet. Folgendes Problem: Ich habe eine aufgrund von genomischen Sequenzen vorhergesagte Proteinsequenz, die allerdings im Vergleich zu homologen Sequenzen einige Inserts an kritischen Stellen enthält. Da man diese nun aber nicht einfach herausschneiden kann, versuche ich ESTs des mutmaßlichen Genprodukts zu finden, u8m meine Schnibbeleien zumindest ansatzweise empirisch abzusichern; hat bis jetzt auch ganz gut geklappt. Der nächste Schritt wäre nun das Alignment der ESTs an die genomische Sequenz (ja, ich weiß, daß jetzt Einige hier die Hände über dem Kopf zusammenschlagen, aber egal...). Ich hatte nun zur Vorbereitung schon einmal mit ClustalX ein Alignment vorgenommen, das ich gerade nachbessere. Und da dabei einige Patzer auffallen, stellen sich für den nächsten Versuch gleich einige Fragen: 1.) Was ich suche, sind kurze, ununterbrochene, möglichst identische Alignments. Mir ist schon klar, daß ich dazu wohl am besten eine relativ hohe gap opening penalty(man verzeihe mein Biologen-Englisch) und eine relativ kleine gap extension penalty verwenden sollte. Hat irgendwer das schon einmal ausprobiert? 2.) Eventuell wäre auch eine modifizierte Substitutionsmatrix von Vorteil, AFAIK sind die mitgelieferten Matrizen eher zum Vergeich verwandter Sequenzen zu verwenden, zumindest habe ich schon einmal den Begriff "nucleotide PAM" bei GENEDOC gehört; wenn man mal davon absieht, daß mir nicht ganz klar ist, was das bedeuten soll (eines von hundert Cytosinen darf ein Guanin sein?) wären auch hier möglichst identische Alignments vorzuziehen; eventuell wäre es eh mal interessant, was der Punkt "custom matrix" bewirkt. Wo könnte man entprechende Dateien besorgen bzw. berechnen? 3.) Mir ist schon klar, daß das Programm eigentlich für etwas anderes gedacht ist, allerdings erscheint mir die Alternative - ca 100 3 kb lange Sequenzen an eine 20 kb lange Sequenz von Hand zu alignen - selbst mit Bioedit nicht als sehr verlockend. Eigentlich wäre spidey ([Only registered users see links. ]) für solche Aufgaben gedacht, allerdings gibt dieses Programm AFAIK nur die identischen Stellen aus, die ich dann wieder von Hand ein- tragen darf. Gibt es eventuell irgendwelche Alternativen? Ach ja, mir ist schon klar, daß man sich eigentlich sein eigenes kleines Perl-Skript schreiben sollte, um diese Aufgabe zu übernehmen, aber leider wollte ich mir Perl erst nach dem Dipl antun... Entschuldigung für die dummen Fragen und schon einmal Danke im voraus für die Antworten... ciao, Andreas -- "The internet can be a very scary place if you dont prepare!" - "How can I prepare?" - "I don't know. Try going to your local middle school's chess club and hand out crystal meth and guns. That might be good practice." [Only registered users see links. ] |
|
#2
| |||
| |||
| On Wed, 2 Nov 2005, Andreas Sielczak wrote: Spätestens an der Stelle hättest Du aufhören können. Wenn Du keinen Akkuschrauber hast, dann hilft Dir der Hammer bei der Schraube auch nichts, egal wie gut er in der Hand liegt. Vermutlich suchst Du sowas, wie das hier: [Only registered users see links. ] Je nach Gegebenheit und Scoring kann man das Alignment auch optimal berechnen: [Only registered users see links. ] (es gibt noch mehr Varianten, eine habe ich vor Jahren mal als teil meiner Diplomarbeit bewiesen :-) ciao -- Alessandro Macrì "panta rhei" (Heraklit) Tel +49 89 2180-4059 [Only registered users see links. ] Fax +49 89 2180-99-4059 [Only registered users see links. ] LMU München, LFE Bioinformatik, Amalienstr. 17, 80333 München, Zi. 201 |
|
#3
| |||
| |||
| Guten Abend Alessandron, Am Thu, 3 Nov 2005 01:56:41 +0100 schrieb Alessandro Macrì: Naja, erklär mal, das du lieber 3 Tage nach einem Programm suchst, das die Aufgabe in 1 Minute erledigt, als 3 Tage von Hand zu alignen, und daß das mal ausnahmsweise keine Ausrede ist... Insgesamt hatte ich: 1.) die von GNOMON vorhergesagte mRNA von Gallus 2.) die entsprechende vorhergesagte Proteinsequenz 3.) die genomische Sequenz 4.) die von BLAST bei der mRNA und der DNA ausgespuckten ESTs. Ein Alignment der Proteinsequenz mit homologen Sequenzen (sagen wir mal "of mice and men") klappte sehr gut, allerdings waren dann halt immer wieder diese Inserts. Meine Hoffnung war nun, das die ESTs nur die Teile abdeckten, die ich wollte, und nicht die Inserts. Nur scheinen einige der BLAST-Ergebnisse sogar auf dem komplementären Strang zu liegen, naja... Naja, aber manchmal ist so ein Hammer auch ganz sinnvoll, vr allem, wenn die Schraube bei einem früheren Versuch sehr viel weicher als der Akkuschrauber war... Bedankt, werd mal gleich an die Herren eine mail schicken, da ich auch noch einige Sequenzen aus etwas, ähm, exotischeren Spezies habe. Allerdings scheint das Programm homologe Proteinsequenzen aus anderen Spezies zu verwenden, während ich ja kurze cDNAs von derselben Spezies verwenden möchte. Ich hab jetzt erst einmal CAP3 verwendet, um die ESTs etwas zu ordnen. [Only registered users see links. ] 10 Sequenzen lassen sich dann etwas leichter bearbeiten als 100. Naja, ich hab da fast den Eindruck, das wären in meinem Fall Kanonen auf Spatzen, aber ich werde es mir mal durchlesen. <mantra>ich will endlich eine Programmiersprache lernen, ich will endlich...</mantra> Noch einmal Danke und Entschuldigung für den Dilletantismus... ciao, Andreas |
| Tags |
| censeo , ceterum , clustalx , delendam , est |
| Thread Tools | |
| Display Modes | |
|
|