Go Back   Science Forums Biology Forum Molecular Biology Forum Physics Chemistry Forum > Regional Molecular Biology Discussion > Forum Biologie
Register Search Today's Posts Mark Forums Read

Forum Biologie Forum Biologie. Germany German Biology Forums.


Ceterum censeo ClustalX delendam EST...

Ceterum censeo ClustalX delendam EST... - Forum Biologie

Ceterum censeo ClustalX delendam EST... - Forum Biologie. Germany German Biology Forums.


Reply
 
LinkBack Thread Tools Display Modes
  #1  
Old 11-02-2005, 03:49 PM
Andreas Sielczak
Guest
 
Posts: n/a
Default Ceterum censeo ClustalX delendam EST...



....oder, wie man multiple sequence alignments zweckentfremdet.

Folgendes Problem: Ich habe eine aufgrund von genomischen Sequenzen
vorhergesagte Proteinsequenz, die allerdings im Vergleich zu homologen
Sequenzen einige Inserts an kritischen Stellen enthält. Da man diese
nun aber nicht einfach herausschneiden kann, versuche ich ESTs des
mutmaßlichen Genprodukts zu finden, u8m meine Schnibbeleien zumindest
ansatzweise empirisch abzusichern; hat bis jetzt auch ganz gut geklappt.
Der nächste Schritt wäre nun das Alignment der ESTs an die genomische
Sequenz (ja, ich weiß, daß jetzt Einige hier die Hände über dem Kopf
zusammenschlagen, aber egal...). Ich hatte nun zur Vorbereitung schon
einmal mit ClustalX ein Alignment vorgenommen, das ich gerade nachbessere.
Und da dabei einige Patzer auffallen, stellen sich für den nächsten Versuch
gleich einige Fragen:
1.) Was ich suche, sind kurze, ununterbrochene, möglichst identische
Alignments. Mir ist schon klar, daß ich dazu wohl am besten eine
relativ hohe gap opening penalty(man verzeihe mein Biologen-Englisch)
und eine relativ kleine gap extension penalty verwenden sollte. Hat
irgendwer das schon einmal ausprobiert?
2.) Eventuell wäre auch eine modifizierte Substitutionsmatrix von Vorteil,
AFAIK sind die mitgelieferten Matrizen eher zum Vergeich verwandter
Sequenzen zu verwenden, zumindest habe ich schon einmal den Begriff
"nucleotide PAM" bei GENEDOC gehört; wenn man mal davon absieht,
daß mir nicht ganz klar ist, was das bedeuten soll (eines von hundert
Cytosinen darf ein Guanin sein?) wären auch hier möglichst identische
Alignments vorzuziehen; eventuell wäre es eh mal interessant, was der
Punkt "custom matrix" bewirkt. Wo könnte man entprechende Dateien
besorgen bzw. berechnen?
3.) Mir ist schon klar, daß das Programm eigentlich für etwas anderes
gedacht ist, allerdings erscheint mir die Alternative - ca 100 3 kb
lange Sequenzen an eine 20 kb lange Sequenz von Hand zu alignen -
selbst mit Bioedit nicht als sehr verlockend. Eigentlich wäre spidey
([Only registered users see links. ])
für solche Aufgaben gedacht, allerdings gibt dieses Programm AFAIK
nur die identischen Stellen aus, die ich dann wieder von Hand ein-
tragen darf. Gibt es eventuell irgendwelche Alternativen?

Ach ja, mir ist schon klar, daß man sich eigentlich sein eigenes kleines
Perl-Skript schreiben sollte, um diese Aufgabe zu übernehmen, aber leider
wollte ich mir Perl erst nach dem Dipl antun...

Entschuldigung für die dummen Fragen und schon einmal Danke im voraus
für die Antworten...

ciao,
Andreas
--
"The internet can be a very scary place if you dont prepare!" - "How can I
prepare?" - "I don't know. Try going to your local middle school's chess
club and hand out crystal meth and guns. That might be good practice."
[Only registered users see links. ]
Reply With Quote
  #2  
Old 11-03-2005, 12:56 AM
Alessandro Macrì
Guest
 
Posts: n/a
Default Ceterum censeo ClustalX delendam EST...

On Wed, 2 Nov 2005, Andreas Sielczak wrote:


Spätestens an der Stelle hättest Du aufhören können. Wenn Du keinen
Akkuschrauber hast, dann hilft Dir der Hammer bei der Schraube auch
nichts, egal wie gut er in der Hand liegt. Vermutlich suchst Du sowas, wie
das hier:
[Only registered users see links. ]

Je nach Gegebenheit und Scoring kann man das Alignment auch optimal
berechnen:
[Only registered users see links. ]
(es gibt noch mehr Varianten, eine habe ich vor Jahren mal als teil meiner
Diplomarbeit bewiesen :-)

ciao

--
Alessandro Macrì "panta rhei" (Heraklit)
Tel +49 89 2180-4059 [Only registered users see links. ]
Fax +49 89 2180-99-4059 [Only registered users see links. ]
LMU München, LFE Bioinformatik, Amalienstr. 17, 80333 München, Zi. 201
Reply With Quote
  #3  
Old 11-04-2005, 12:22 AM
Andreas Sielczak
Guest
 
Posts: n/a
Default Ceterum censeo ClustalX delendam EST...

Guten Abend Alessandron,
Am Thu, 3 Nov 2005 01:56:41 +0100 schrieb Alessandro Macrì:


Naja, erklär mal, das du lieber 3 Tage nach einem Programm suchst, das
die Aufgabe in 1 Minute erledigt, als 3 Tage von Hand zu alignen, und
daß das mal ausnahmsweise keine Ausrede ist...

Insgesamt hatte ich:
1.) die von GNOMON vorhergesagte mRNA von Gallus
2.) die entsprechende vorhergesagte Proteinsequenz
3.) die genomische Sequenz
4.) die von BLAST bei der mRNA und der DNA ausgespuckten ESTs.

Ein Alignment der Proteinsequenz mit homologen Sequenzen (sagen wir mal
"of mice and men") klappte sehr gut, allerdings waren dann halt immer
wieder diese Inserts. Meine Hoffnung war nun, das die ESTs nur die Teile
abdeckten, die ich wollte, und nicht die Inserts. Nur scheinen einige der
BLAST-Ergebnisse sogar auf dem komplementären Strang zu liegen, naja...


Naja, aber manchmal ist so ein Hammer auch ganz sinnvoll, vr allem, wenn
die Schraube bei einem früheren Versuch sehr viel weicher als der
Akkuschrauber war...


Bedankt, werd mal gleich an die Herren eine mail schicken, da ich auch
noch einige Sequenzen aus etwas, ähm, exotischeren Spezies habe.
Allerdings scheint das Programm homologe Proteinsequenzen aus anderen
Spezies zu verwenden, während ich ja kurze cDNAs von derselben Spezies
verwenden möchte.

Ich hab jetzt erst einmal CAP3 verwendet, um die ESTs etwas
zu ordnen.
[Only registered users see links. ]

10 Sequenzen lassen sich dann etwas leichter bearbeiten als
100.


Naja, ich hab da fast den Eindruck, das wären in meinem Fall
Kanonen auf Spatzen, aber ich werde es mir mal durchlesen.


<mantra>ich will endlich eine Programmiersprache lernen, ich will
endlich...</mantra>

Noch einmal Danke und Entschuldigung für den Dilletantismus...

ciao,
Andreas
Reply With Quote
Reply

Tags
censeo , ceterum , clustalx , delendam , est


Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Trackbacks are On
Pingbacks are On
Refbacks are On

Forum Jump


All times are GMT. The time now is 05:49 AM.


Powered by vBulletin® Version 3.8.4
Copyright ©2000 - 2014, Jelsoft Enterprises Ltd.
Copyright 2005 - 2012 Molecular Station | All Rights Reserved
Page generated in 0.13416 seconds with 15 queries