Direkt zum Inhalt

Mobile Protein-Module: evolutionär alt oder jung?

Viele Proteine setzen sich aus einer recht kleinen Zahl modulartiger Einheiten zusammen. Wie diese sich im Laufe der Evolution ausgebreitet und vervielfältigt haben, ist noch nicht völlig geklärt; gewisse Regeln zeichnen sich jedoch ab.

In den vergangenen Jahrzehnten hat sich gezeigt, daß zahlreiche Proteine aus Domänen bestehen: abgrenzbaren Blöcken von Aminosäuren, die vielfach eine festumrissene Teilfunktion haben. Einige dieser Module sind im Laufe der Evolution wiederholt sowohl in einem Protein als auch zwischen verschiedenen Proteinen gewandert, das heißt, entsprechende Abschnitte der DNA haben im Erbgut andere Positionen eingenommen.

Solche Sprünge vollzogen sich nicht nur innerhalb der Artgrenzen. In manchen Fällen vermochten die Gene für solche Einheiten offenbar zwischen nicht verwandten Spezies und sogar von tierischen in bakterielle Zellen zu wechseln.

Weil die Genregionen, die für Proteine codieren, ebenfalls abgrenzbare Untereinheiten aufweisen, sind viele Biologen überzeugt, daß dem ein gemeinsames, entwicklungsgeschichtlich altes Phänomen zugrunde liege. Ihrer Meinung nach entspricht jede codierende Teilregion eines Gens einem bestimmten strukturellen Merkmal in einem Protein.

Wir und unsere Kollegen sehen das etwas anders. Die unserer Vorstellung nach gewichtigeren Indizien sprechen dafür, daß die Unterteilung von Genen in getrennte codierende Bereiche eine nach evolutionärem Zeitmaß weitaus jüngere Entwicklung ist.

Stabile Faltung – eine Frage der Kettenlänge

Proteinmoleküle sind lange Ketten aus Aminosäuren. Zwanzig verschiedene solcher Bausteine, jeweils von eigener Gestalt und bestimmtem chemischem Charakter, hält die Natur dafür bereit; und sämtliche Eigenschaften eines Proteins hängen davon ab, welche Aminosäuren bei ihm in welcher Reihenfolge miteinander verkettet sind.

Vor allem legt die Aminosäuresequenz fest, wie sich das Protein räumlich faltet, also seine funktionsfähige Gestalt annimmt. Ihre Länge spielt dabei eine wichtige Rolle. Bis zu einige tausend Aminosäuren können zu einer sogenannten Polypeptidkette verknüpft sein (den Rekord hält bisher Titin, ein Muskeleiweiß, mit mehr als 30000).

Kurze Ketten haben jedoch nicht genügend intramolekulare Kräfte oder Bindungen, um in einer einzigen Konformation sozusagen einrasten zu können; darum neigen sie dazu, von einer in die andere zu wechseln. Gewöhnlich besitzen Polypeptide erst ab einer Länge von 30 bis 40 Aminosäuren so viel inneren Zusammenhalt, daß sie bevorzugt eine bestimmte Form annehmen. Sie sind dabei aber unter Umständen immer noch auf eine zusätzliche Stabilisierung – etwa durch gebundene Metall-Ionen oder Disulfid-Brücken zwischen zwei Cysteinen – angewiesen (diese Aminosäure kann mit ihresgleichen Schwefelbrücken ausbilden).

Jedes Protein mit mehr als nur einer Mindestzahl verketteter Aminosäuren faltet sich hingegen in einem definierten Milieu auf immer dieselbe Weise. Das kann eine verdünnte Salzlösung sein, wie die meisten biologischen Flüssigkeiten es im Prinzip sind, oder etwa das fettähnliche Innere einer Zellmembran. Zum Milieu können auch andere umliegende Proteine oder sogar Teile derselben Polypeptidkette gehören, wenn diese recht lang ist.

Eine Sequenz, die unter definierten Bedingungen spontan eine charakteristische Gestalt annimmt, nennt man eine Domäne (allerdings wird diese formale Definition selten strikt beachtet; häufiger wird der Begriff auf jeden beliebigen Teil eines Proteins angewandt, der sich strukturell vom Rest abgrenzen läßt). Einige kleine Proteine bestehen nur aus einer einzigen Domäne. Viele andere enthalten zwei oder mehr und manche sogar viele Domänen, deren Gestalt sehr ähnlich oder grundverschieden sein kann.

Auf direkteste Weise läßt sich eine Domäne durch eine Röntgenstrukturanalyse von Proteinkristallen oder durch NMR-Spektroskopie (nuclear magnetic resonance, Kernspinresonanz) identifizieren. Kennt man ihre räumliche Struktur samt der Aminosäuresequenz, dann lassen sich andere verwandte Domänen ohne vorherige Strukturanalyse finden; man sucht einfach nach ähnlichen Sequenzen. Diese Methode ist deshalb außerordentlich nützlich, weil von sehr viel mehr Proteinen ihre Aminosäureabfolge als ihr räumlicher Aufbau geklärt ist. Oft ist es auch möglich, die Existenz einer Domäne allein aus der Sequenz abzuleiten. Wenn man die Struktur- und Sequenzähnlichkeiten von Proteinen unter diesem Aspekt betrachtet, läßt sich viel über deren Evolution lernen.

Modulbauweise

Bis in die frühen siebziger Jahre konzentrierte sich die Lehrmeinung zur Protein-Evolution hauptsächlich auf die beiden Prozesse Verdoppelung und Modifizierung. Ein Gen für ein Protein verdoppelt sich gelegentlich durch verschiedene Rekombinationsprozesse, bei denen Material zwischen DNA-Strängen ausgetauscht wird. Manchmal resultiert daraus ein getrenntes zweites Gen, das sich – ohne dem Organismus zu schaden – abwandeln und mutieren kann, bis es schließlich für ein neues Protein mit neuer Funktion codiert. Oder aber die verdoppelte DNA bildet eine Tandem-Anordnung mit der ursprünglichen. In diesem Fall wird die Aminosäurekette länger, und dadurch kann das Protein womöglich neuartige Eigenschaften bekommen. Wie aus Sequenzvergleichen klar hervorgeht, sind zahlreiche Proteine infolge solcher internen Verdoppelungen entstanden – kleine wie die bakteriellen Ferredoxine mit nur 56 Aminosäureresten bis hin zu derart großen wie die bakterielle Beta-Galaktosidase mit mehr als 1000.

Vor rund 20 Jahren jedoch stieß Michael G. Rossmann von der Purdue-Universität in West-Lafayette (Indiana) auf einen bis dahin verborgenen Aspekt der Protein-Evolution. Ihm fiel auf, daß das Enzym Lactatdehydrogenase, dessen Raumstruktur er gerade durch Röntgenbeugung bestimmt hatte, anderen ihm bekannten Proteinen in einem Bereich stark ähnelt. Und zwar hat der Teil des Enzyms, der einen Kofaktor bindet, offensichtlich Pendants in anderen Dehydrogenasen, aber bemerkenswerterweise nicht immer in den einander entsprechenden Regionen der Moleküle. Es schien, als ob diese Einheit im Laufe der Evolution innerhalb der linearen Aminosäuresequenz gewandert wäre, ohne dabei ihre Funktion – also ihre Fähigkeit, den Kofaktor zu binden – einzubüßen. Rossmann schlug als Erklärung vor, daß Proteine aus Modulen – den heutigen Domänen – aufgebaut sind, die bereits früh in der Geschichte des Lebens in Erscheinung traten, und die entsprechenden DNA-Abschnitte sich zu verschiedenen Kombinationen zusammensetzten.

Diese Art und Weise der Protein-Evolution eröffnete Möglichkeiten, die weit über das hinaus gehen, was reine Verdoppelung und Modifizierung leisten. Wenn sich neue Proteine durch Neukombination (Rekombination) des genetischen Materials für Komponenten anderer erzeugen ließen, dann konnte die Vielfalt an Proteinen geradezu explosionsartig wachsen.

Inzwischen sind von zahlreichen großen Proteinen die Aminosäuresequenzen bestimmt, und tatsächlich zeigen viele einen annähernd repetitiven Aufbau, wie man ihn von einer Kette mobiler Module erwarten würde. Das im Blutserum und im Bindegewebe vorkommende Protein Fibronectin zum Beispiel besteht aus zwei langen Ketten mit jeweils mehr als 2000 Aminosäureresten. Sie setzen sich aus Serien von drei verschiedenen Typen sich wiederholender Sequenzen zusammen (Bild 2 oben). Die Längen der Einheiten, die als Fn1, Fn2 und Fn3 bezeichnet werden, liegen in einer Größenordnung von 45, 60 und 90 Aminosäuren. (Die Wiederholungen eines Typs sind allerdings unvollkommen in dem Sinne, daß nicht alle ganz identisch sind.) Vermutlich kann sich jede Einheit unabhängig als eine echte Domäne falten, und das ganze – entfaltete – Protein dürfte wie eine lange Halskette aus drei Arten von Perlen aussehen.

Überraschenderweise wurden ähnliche Sequenzen wie Fn1, Fn2 und Fn3 dann bei vielen weiteren tierischen Proteinen gefunden; und so war es auch bei etlichen anderen identifizierten Domänen. Zum Beispiel besteht der epidermale Wachstumsfaktor (EGF nach englisch epidermal growth factor) aus nur einer einzigen Domäne, die beim Menschen 53 Aminosäuren umfaßt; sie ist kompakt gefaltet und wird von drei Disulfid-Brücken zusammengehalten. Ähnliche Domänen wurden durch Sequenzvergleiche bei mehr als hundert Proteinen entdeckt, und zwar in bis zu dreißigfacher Ausfertigung.

Die Funktion vieler dieser Module ist noch nicht ganz klar, aber etliche binden oder erkennen bestimmte Substanzen. Das ist etwa der Fall bei einer Familie von Lektinen, die verschiedene Kohlenhydrate binden. Auch die Immunglobulin-Domäne, ein Merkmal von Antikörpern und anderen Molekülen des Immunsystems, ist für ihre Bindungsfähigkeit bekannt. Manche Domänen dienen möglicherweise als eine Art Etikett, das ein Protein als einem bestimmten Gewebe zugehörig kennzeichnet. Viele scheinen lediglich Bindeglieder oder Abstandshalter zu sein, eher nichtssagende Einheiten zur Verknüpfung anderer. Manche haben vielleicht sogar keinerlei Funktion.

Wie es aussieht, können sich also viele Domänen in evolutionären Zeiträumen in und zwischen Proteinen bewegen (wohlgemerkt vollziehen sich die eigentlichen Sprünge auf genetischer Ebene). Solange durch eine Verlagerung kein Schaden oder Funktionsverlust auftritt, kostet es evolutionär gesehen Organismen wenig, eine Domäne in einem neuen Umfeld zu belassen. Das ist logischerweise aus der Theorie der neutralen Evolution zu folgern, wonach genetische Veränderungen, die zunächst weder schaden noch nutzen, keiner negativen oder positiven Selektion unterliegen.

Gespaltene Gene

Als Rossmann aus seinen Molekülvergleichen folgerte, Module könnten sich in und zwischen Proteinen bewegen, dachte niemand sonderlich ernsthaft darüber nach, welche genetischen Mechanismen solche Umordnungen bewirken dürften. Wenig später stießen Molekularbiologen jedoch auf ein unerwartetes Merkmal von Genen, das eine Erklärung zu liefern schien.

Bekanntlich ist die genetische Information – insbesondere die Bauanleitung für Proteine – in der DNA (Desoxyribonucleinsäure) gespeichert, und zwar in der Reihenfolge ihrer Bausteine, der Nucleotide. Sie wird in eine komplementäre Boten-RNA (eine Ribonucleinsäure) umgeschrieben, die zu den Ribosomen, den Proteinfabriken der Zelle, wandert. Dort wird die genetische Information umgesetzt, wobei je drei Nucleotide als Codewort für eine Aminosäure stehen.

Die überraschende Entdeckung Mitte der siebziger Jahre war nun, daß die für ein Polypeptid codierende DNA (eben ein Gen) von nicht-codierenden Sequenzen unterbrochen sein kann – Serien von Nucleotiden, die keinen Abschnitten der Aminosäuresequenz im fertigen Protein entsprechen. Die nicht-codierenden Sequenzen werden durch einen Spleiß-Mechanismus herausgeschnitten, noch bevor die Boten-RNA in ein Polypeptid übersetzt wird.

Dieser Befund brachte Walter Gilbert von der Harvard-Universität in Cambridge (Massachusetts) auf die Idee, die nicht-codierenden Sequenzen, die er Introns nannte (nach englisch intervening, eingeschoben), erleichterten möglicherweise den Austausch der codierenden Teile eines Gens, der Exons (der exprimierten Sequenzen). Denn der zusätzliche Abstand zwischen codierenden Abschnitten böte anteilig mehr Gelegenheit zu Rekombinationen, die auf zufälligen Strangbrüchen in der DNA beruhen.

Wenn zudem Ähnlichkeiten zwischen den Sequenzen der Introns bestünden, könnten diese während der Rekombination Fehlausrichtungen und ungleiche Crossing-overs fördern und somit die Umordnung von Genen vereinfachen. Damals gab es noch keinerlei Hinweise auf tatsächlich vorhandene Ähnlichkeiten, doch hat sich bei nachfolgenden Untersuchungen gezeigt, daß Introns eine Vielzahl mobiler genetischer Elemente beherbergen; und die darin vorhandenen ähnlichen Sequenzen können zu genetischen Fehlpositionierungen während der Meiose beitragen (diese sogenannten Reifeteilungen sorgen dafür, daß die für eine geschlechtliche Vermehrung nötigen Ei- und Samenzellen nur die halbe Chromosomenzahl enthalten; mit der Meiose gehen auch Rekombinationen einher).

Freilich gibt es bei vielen Organismen überhaupt keine Meiose, weil sie sich nur asexuell vermehren. Haben sie etwa eine glänzende Chance zum Aufbau neuer Proteine verpaßt?

Introns, welche die für ein Protein codierenden Bereiche unterbrechen, finden sich nur in der DNA von Eukaryonten (deren Zellen enthalten anders als Bakterien, also Prokaryonten, einen echten Zellkern). Die Protein-Gene von Bakterien sind frei von Introns: Jedes Dreier-Set von Nucleotiden entspricht einer Aminosäure im Protein. (Einige wenige Arten von Introns sind zwar inzwischen bei Bakterien entdeckt worden; sie tangieren aber nicht direkt das hier diskutierte Thema.)

Dieses Fehlen von Introns inspirierte Ford Doolittle von der Dalhousie-Universität in Halifax (Canada) und James Darnell von der Rockefeller-Universität in New York unabhängig voneinander zu der Hypothese, Bakterien als urtümliche Organismen hätten früher einmal Introns besessen, inzwischen aber verloren. Ihre Genome (ihr Erbgut) seien im Laufe der Evolution vermutlich von nicht unbedingt Notwendigem entlastet worden, um ihre DNA-Replikation effizienter zu machen. Demnach sollten Introns seit Anbeginn des Lebens existieren, und die kurzen codierenden Sequenzen müßten getrennt entstanden sein.

Exons – nicht generell mobil

Die Folgerung der beiden Wissenschaftler entfachte einen noch immer nicht beigelegten Streit darüber, ob Introns früh in der Entwicklungsgeschichte auftraten und grundlegend für den Ursprung aller Proteine sind oder erst später hinzukamen. Letzteres vertritt Thomas Cavalier-Smith, der inzwischen an der Universität von British Columbia in Vancouver arbeitet. Seiner Hypothese nach dürfte es sich bei den Introns um invasive Nucleinsäureabschnitte handeln, die als transponierbare genetische Elemente oder Transposons bekannt sind; sie würden jenen symbiontischen Organismen entstammen, aus denen schließlich die Mitochondrien und andere Organellen der eukaryontischen Zelle hervorgegangen sind. Sein Modell hat unter anderen Donal Hickey von der Universität Ottawa weiter ausgebaut.

Die DNA-Abschnitte, die für die evolutionär mobilen Module in Proteinen codieren, sind allerdings – wie sich gezeigt hat – zwar oft, aber nicht immer von Introns flankiert. Bei vielen Proteinen werden also die einzelnen strukturellen Einheiten von je einem Exon codiert. Das nährte den weit verbreiteten Glauben, alle Exons seien evolutionär mobil und die von ihnen codierten Proteinkomponenten potentiell modulartige Baublöcke.

Unserer Ansicht nach ist diese Auffassung in zweierlei Hinsicht falsch. Zum einen können, wie Lázló Patthy vom Institut für Enzymologie in Budapest zuerst darlegte, sehr wohl alle Exons umgelagert werden, doch nur ein Bruchteil davon läßt sich danach noch sinngemäß – dem alten Leseraster entsprechend – in Aminosäuresequenzen übersetzen. Denn wenn sich ein Intron in eine durchgehend codierende Sequenz einnistet, kann es diese an drei möglichen Positionen des Leserasters unterbrechen (Bild 3): zwischen zwei Codons (Typ 0), zwischen dem ersten und zweiten Nucleotid eines Codons (Typ 1) oder zwischen dem zweiten und dritten (Typ 2). Wenn nun ein solches Intron sich samt der nachfolgenden codierenden Sequenz verlagert, muß es sich wieder an demselben Positionstyp integrieren – sonst würde sich das Leseraster hinter ihm verschieben und bei der Übersetzung eine andere, sinnentstellte Aminosäuresequenz herauskommen. Bei rein zufälliger Integration von Introns sollte nur ein Drittel der neuen Exon-Kombinationen mit der ursprünglichen Sequenz sozusagen in Phase sein. Merkwürdigerweise sind die Gensequenzen für Module, die am häufigsten verlagert wurden, in der überwältigenden Mehrheit von Introns vom Typ 1 flankiert.

Der zweite wesentliche Grund, warum nur einige Exons evolutionär mobil sind, liegt darin, daß nur echte Domänen – jene also, die sich gänzlich unabhängig zu falten vermögen – in einer neuen, durch das übrige Protein gebildeten Umgebung bestehen können. Kleinere, weniger selbständige Aminosäuresequenzen wären unfähig, sich allein zu falten, und würden somit ihre Identität verlieren. Mehr noch, wenn eine sich verlagernde DNA-Einheit zwischen zwei Exons landet, die für keine echten Domänen codieren, kann sich womöglich das erweiterte Protein selbst nicht mehr richtig falten.

Diese beiden Faktoren – der eine genetischer, der andere struktureller Art – tragen viel dazu bei, daß mobile Domänen so häufig gemeinsam auftreten; manche Eiweißstoffe sind sogar Mosaike mit bis zu fünf verschiedenen gemeinsam verlagerten Modulen. Diese Typen von Proteinen tolerieren sowohl die genetischen als auch die strukturellen Umlagerungen.

Argumente gegen frühes Auftreten

Den Befund, daß viele Module von Exons codiert werden, hat man als Stütze für die Vorstellung interpretiert, die Urorganismen hätten all ihre Proteine quasi aus einem Inventar exon-codierter primitiver Strukturelemente zusammengestellt. Mehrere Punkte sprechen jedoch dagegen.

Zum einen zeigt schon eine simple Rechnung, daß die hypothetischen frühen Exons nicht für Proteinkomponenten hätten codieren können, die sich unabhängig zu falten vermochten – sie waren zu klein. Die bekannten Exons in Wirbeltier-Genomen haben eine Durchschnittslänge von 135 Nucleotiden, was einem Polypeptid aus lediglich 45 Aminosäuren entspricht. Ein so kurzer Kettenabschnitt benötigt üblicherweise eine Stabilisierung, damit er eine beständige Konformation annehmen kann.

Ferner ist zu bedenken, daß den Verfechtern entwicklungsgeschichtlich früher Introns nach solche Sequenzen mit der Zeit verlorengehen. Dies anzunehmen sind sie gezwungen, weil bei verschiedenen Spezies Introns nur sporadisch auftreten. Eine ungleichmäßi- ge Verteilung auf verschiedene Linien könnte zwar genausogut das Ergebnis eines nachträglichen Hinzukommens sein; doch wenn man die Vorstellung hegt, Introns seien von Anfang an dagewesen, dann ist ein Verlust die einzige Erklärung. Der Verlust eines Introns bedeutet aber, daß die flankierenden Exons zu einem gemeinsamen größeren fusioniert werden. Folglich hätten die frühesten Exons noch kleiner als die heutigen sein müssen, und die von ihnen codierten Polypeptide wären wohl kaum imstande gewesen, sich von selbst zu einer Domäne zu falten.

Ein weiteres Gegenargument betrifft die Verteilung der Domänen auf Proteine. Im großen und ganzen sind die bekannten mobilen Module in der Mehrzahl auf Proteine von Tieren beschränkt. Bislang wissen wir noch nicht wirklich, wann oder wo die meisten von ihnen erstmals aufgetreten sind. Vielleicht ist ihre Spur in der Stammesgeschichte teilweise verwischt worden, weil sich die Sequenzen in den verwandten Domänen von Pflanzen, Pilzen und Einzellern (Protozoen) umfassend verändert haben. Wie wir noch diskutieren werden, könnte der Umstand, daß Raumstrukturen in einem evolutionären Sinne beständiger sind als die sie bildenden Sequenzen, zur Lösung des Rätsels beitragen.

Außer daß die meisten Exons den Indizien nach nicht evolutionär mobil sind, werden überdies einige bewegliche Domänen offensichtlich nicht von einem einzelnen Exon codiert. Eine große, erstmals im Fibrinogen-Molekül von Wirbeltieren erkannte Domäne umfaßt 250 Aminosäuren und tritt auch in anderen Proteinen auf. Bei manchen enthält der Genabschnitt für diese Domäne mehrere Introns. Doch keines der einzelnen Exons wurde jemals ohne alle anderen gefunden; offenbar hat keines sich jemals selbständig gemacht. Demnach reicht die bloße Anwesenheit von Introns in einem Genbereich nicht, um Exons beweglich zu machen. Die Beobachtung, daß die breite Mehrheit identifizierter Exons niemals in einer anderen Umgebung angetroffen wurde, spricht gegen eine simple, unterschiedslose Mobilität.

Es gibt weitere Beispiele für bewegliche DNA-Einheiten, die Introns in ihrer codierenden Sequenz enthalten. Zu den Produkten zählt einer der ältesten bekannten beweglichen Module namens Kringel – so bezeichnet wegen seiner Ähnlichkeit mit einem dänischen Gebäck. Er umfaßt rund 80 Aminosäuren, enthält drei charakteristische Disulfid-Brücken und ähnelt stark der Fn2-Domäne – nur die Zahl der Aminosäuren zwischen den brückenbildenden Cysteinen ist verschieden. (Manche Forscher machen zwischen Kringel und Fn2 keinen Unterschied.) Gelegentlich ist der Genabschnitt für die Kringel-Domäne durch ein Intron unterteilt, aber bislang hat noch niemand einen halben Kringel in irgendeinem Protein gefunden.

Für ein spätes Auftreten von Introns spricht des weiteren, daß solche, die codierende Sequenzen unterbrechen, sehr viel häufiger bei Pflanzen und Tieren vorkommen als bei den frühesten Eukaryonten. Bei primitiven Eukaryonten wie Giardia lamblia (einem parasitischen Geißeltierchen, das Ruhr hervorruft) hat man sogar überhaupt keine Introns gefunden. Ferner kennt man modulare Proteine von Pflanzen, für die kein sichtliches Gegenstück in Tieren existiert, und umgekehrt. Schließlich gibt es indirekte Hinweise, wonach der modulare Aufbau einiger bakterieller Proteine eine so junge Errungenschaft ist, daß sie sich ohne Hilfe von Introns entwickelt haben müssen. All dies legt nahe, daß Introns, die Proteinsequenzen unterbrechen, erst nach der Entstehung der Eukaryonten aufgetreten sind.

Manche Exons codieren also für Domänen, die meisten tun es aber nicht. Erstere können oft verdoppelt und verschoben werden. Was dabei Ursache, was Wirkung ist, wäre sehr schwer zu entscheiden.

Vielleicht erleichterte die Entwicklung dieser Introns wirklich das genetische Mischen von Exons, so daß neue Proteine entstehen konnten. Andererseits ist aber nicht ausgeschlossen, daß Introns deshalb so oft die für Domänen codierenden Bereiche säumen, weil diese Plazierung für ihre eigene Verbreitung vorteilhaft ist. Unterbräche ein Intron die für eine Domäne codierende Sequenz, könnte es zwar dort möglicherweise überleben, solange es nicht die erwähnte Phasenregel verletzt; doch würde es sich nicht weiterverbreiten, da die beiden flankierenden Exons (als Teile des ursprünglichen Exons) nicht allein bestehen könnten und sich deshalb nicht unabhängig voneinander umlagern ließen. Landet ein Intron hingegen zwischen Bereichen, die für unabhängig sich faltende Einheiten codieren, kann es sich zusammen mit den Exons an andere Stellen bewegen. Das Mischen von Exons könnte also ein Nebeneffekt der Überlebensstrategie von Introns sein.

Aneignung tierischer Exons durch Bakterien

Um mehr über die Evolution mobiler Module zu erfahren, haben wir uns auf die Struktur und Verbreitung von Fn3 konzentriert, die Typ-III-Domäne des Fibronectins. Wie jene für Kringel sind auch die DNA-Abschnitte für Fn3 manchmal durch einzelne Introns unterteilt, die Proteinkomponenten aber immer komplett – mit dem vollen Satz von 90 bis 100 Aminosäuren – anzutreffen.

Wir hatten zunächst unabhängig voneinander mehrere Jahre lang verfolgt, wie Fn3 nach und nach in diversen Proteinen entdeckt wurde. Anfangs waren es ausschließlich solche von Tieren – deshalb überraschte es uns, als Forscher der Universität Niigata (Japan) von einer Fn3-Domäne in einem bakteriellen Protein berichteten. Als wir 1991 auf einer Konferenz in Italien unser gemeinsames Interesse erkannten, beschlossen wir, zusammen einen umfassenden Überblick über das Vorkommen von Fn3 zu erarbeiten.

Dazu durchforsteten wir eine Datenbank für Proteinsequenzen unter anderem mit einem muster-vergleichenden Algorithmus, den einer von uns (Bork) zusammen mit Christian Grunwald damals am Zentralinstitut für Molekularbiologie in Ostberlin entwickelt hatte. Auf diese Weise ermittelten wir erheblich mehr als 300 einzelne Vorkommen des Fn3-Sequenzmotivs (ein nochmals zweifelsfreier Beleg für eine echte Domäne); sie repräsentierten 67 unterschiedliche Proteine, wenn man dasselbe Protein aus verschiedenen Spezies nur einmal zählt – 60 aus Tieren und sieben aus Bakterien, also keine aus Pflanzen, Pilzen oder einzelligen Eukaryonten.

Hatten Bakterien und Tiere diese Domäne von irgendeinem gemeinsamen Vorfahren ererbt, oder hat eine der beiden Gruppen sie auf irgendeine Weise von der anderen übernommen? Wenn die Domäne bereits in dem gemeinsamen Vorfahren von Pro- und Eukaryonten vorhanden war, warum ist sie dann nicht auch in Pilzen und Pflanzen zu finden?

Vom Computer ließen wir die ermittelten Fn3-Sequenzen so untereinander schreiben, daß einander entsprechende Aminosäuren in derselben Spalte stehen, wobei bei manchen Sequenzen Leerstellen eingefügt werden müssen. Aufgrund ihrer Ähnlichkeiten versuchten wir einen groben Stammbaum zu konstruieren. Da dies mit mehr als 300 Sequenzen nur mühsam zu bewerkstelligen gewesen wäre, begannen wir mit einer repräsentativen Auswahl, welche die Fn3-Sequenzen aller bakteriellen Proteine, aber nur jene der tierischen enthielt, die sich am stärksten unterschieden.

Bald schon stellte sich heraus, daß irgend etwas nicht stimmen konnte. Die bakteriellen Sequenzen waren den tierischen einfach zu ähnlich, als daß sie von einem gemeinsamen Vorfahren von vor zwei Milliarden Jahren hätten stammen können. Statt dessen sprachen mehrere Befunde – einschließlich der mittels Computer erzeugten Stammbäume – dafür, daß die Bakterien die Fn3-Domäne irgendwie von Tieren erworben haben (Bild 4).

Zum einen ist häufig die Domäne in einem Enzym einer Bakterienart vorhanden, im gleichen Enzym einer anderen Bakterienart aber nicht; da sie folglich zum Erhalt von Struktur und Funktion dieses Proteins nicht nötig ist, muß es sich um einen späten Erwerb ganz bestimmter Bakterien handeln. Zum anderen treten die Fn3-Domänen sowohl verstreut als auch in Gruppen auf, aber immer in einem charakteristischen Satz von Enzymen, die von der Bakterienzelle nach außen abgegeben werden. Hätten Mikroorganismen seit je Fn3-Domänen besessen, die meisten sie aber mit der Zeit verloren, dürfte man noch existierende Exemplare bei den unterschiedlichsten Bakterienproteinen erwarten.

Schließlich haben die mit Fn3-Domänen ausgestatteten Bakterien, obwohl sie verschiedenen Gruppen angehören, gewisse Eigenheiten gemeinsam. Alle leben im Erdboden und ernähren sich von verbreitet vorkommenden Polymeren wie Cellulose oder Chitin, die bei der Zersetzung anderer Organismen frei werden. Eine Vielzahl anderer Bakterienarten ist durchsucht worden, aber keine hat die Fn3-Domäne in irgendeinem ihrer Proteine. Beispielsweise ist beim Darmbakterium Escherichia coli mehr als die Hälfte des Erbguts bereits sequenziert, aber nirgendwo auch nur die Spur einer für Fn3 codierenden Sequenz aufgetaucht. Gleiches gilt für die große Zahl untersuchter Pilz- und Pflanzen-Sequenzen. Wäre die Fn3-Domäne bereits in einem gemeinsamen Vorfahren von Eu- und Prokaryonten vorhanden gewesen, sollte sie sich bei der Aufspaltung in die einzelnen Stammlinien mit ausgebreitet haben und in allen diesen Organismengruppen vertreten sein.

Horizontaler Gentransfer

Die Vorstellung, ein Gen oder ein Stück davon könne zu sehr entfernt verwandten Organismen gelangen, mag zunächst abwegig scheinen. Schließlich werden Gene vertikal, also von einer Generation zur nächsten, weitergegeben. Dennoch ist es manchmal möglich, daß sie auch horizontal übertragen werden, nicht nur über Artgrenzen, sondern sogar noch über entfernte Abstammungslinien hinweg.

Manche Viren sind imstande, kleine Gene aus dem Erbgut eines Wirts aufzunehmen und durch Infektion auf einen anderen zu übertragen; in seltenen Fällen kann das eingeschleppte Gen sich sogar in die DNA des neuen Wirts einfügen. Bakterien können DNA aus ihrer Umgebung aufnehmen, etwa aus sich zersetzenden Tierzellen. Viele enthalten überdies Plasmide, kleine ringförmige Zusatz-DNA, die sie mit anderen Bakterien auszutauschen vermögen. Theoretisch bieten all diese Mechanismen Gelegenheit, Gene horizontal zu übertragen (Bild 5).

Angenommen, manche Bakterien hätten das Gen für eine Fn3-Domäne wirklich aus einer tierischen Zelle erhalten. Vor wie langer Zeit könnte das geschehen sein?

Dem phylogenetischen Stammbaum ist lediglich zu entnehmen, daß dies innerhalb der letzten Jahrmilliarde passiert sein muß, nämlich nach der Trennung der Entwicklungslinie der Tiere von derjenigen der Pflanzen und Pilze. Für eine genauere Datierung müßten wir wissen, mit welchen Durchschnittsgeschwindigkeiten sich Sequenzen in den bakteriellen und den tierischen Entwicklungslinien verändert haben. Für die Tierproteine können wir diese Werte abschätzen, indem wir Sequenzen verschiedener Arten vergleichen, für die sich der Zeitpunkt der Abspaltung aus der fossilen Überlieferung ablesen läßt. Leider haben wir keine vergleichbaren paläontologischen Informationen über Bakterien. (Zwar sind einige Mikrofossilien, die Prokaryonten entsprechen, beschrieben worden, ein interpretierbarer Stammbaum aber wie für Tiere fehlt jedenfalls noch.)

Was wir jedoch sowohl bei den Tier- als auch bei Bakterienproteinen feststellen, ist eine Tendenz zu Tandem-Verdoppelungen von Fn3-Sequenzen – das heißt, wenn mehr als eine davon vorhanden ist, sind sie oft benachbart und gewöhnlich einander sehr ähnlich. Dies legt nahe, daß sich die DNA für die Fn3-Domäne erst vor relativ kurzer Zeit vervielfacht hat.

Für das Verständnis der Ausbreitungsweise dieser genetischen Einheiten ist der zeitliche Ablauf der horizontalen Übertragung und der genetischen Verdoppelungen entscheidend. Soweit bekannt, haben heutige Bakterien im allgemeinen keine Introns in ihren protein-codierenden Sequenzen. Sollten sie jemals welche gehabt haben, wann haben sie dann ihre Introns verloren? Sofern dies nicht erst vor ziemlich kurzer Zeit passiert ist, müßten sich die Genabschnitte für Fn3 ohne die Hilfe von Introns unter ihnen ausgebreitet haben.

Denkbare Möglichkeiten sind, daß das genetische Material für die Fn3-Domäne von einem häufig den Wirt wechselnden Bakteriophagen (einem Virus, das Bakterien befällt) oder mit einem Plasmid zwischen Bodenbakterien transferiert wird. Wir hoffen, einmal einen Phagen, der gerade Fn3-DNA verschleppt, zu finden. Da wir eine Anzahl bakterieller Fn3-Sequenzen kennen, ist es möglich, entsprechend dem genetischen Code kurze DNA-Sequenzen herzustellen, die sich an die für Fn3 codierenden genetischen Einheiten heften (komplementäre DNA-Stränge lagern sich zusammen) und gleichsam Etiketten abgeben. In Verbindung mit der als Polymerase-Kettenreaktion bekannten Vervielfältigungsmethode für DNA könnten diese helfen, die Gene in Phagen oder anderen Überträgern zu identifizieren (siehe Monatsspektrum in diesem Heft, Seite 16).

Der Ursprung der Fn3-Domäne liegt freilich noch im dunkeln. Trat sie wirklich erst in Tieren auf? Oder sind wir nur nicht imstande, die inzwischen abgewandelten Urformen durch Sequenzvergleich zu ermitteln?

Raumstrukturanalysen zeigen, daß Fn3 den Domänen von Immunglobu- linen verdächtig ähnelt (Bild 1). Dank solcher Analysen lassen sich die Immunglobulin-Domänen inzwischen bis hin zu Prokaryonten-Proteinen zurückverfolgen, darunter zu PapD, einem als Faltungshelfer für andere Proteine dienenden Chaperon, sowie zu einem bakteriellen Enzym, das Cellulose abbaut. Interessanterweise enthalten die Immunglobulin-Domänen, wie sie ursprünglich definiert waren, eine Disulfid-Brücke, die beide Flanken zusammenhält; diese fehlt jedoch in den primitiveren Varianten, von denen einige selbst in Wirbeltieren noch erhalten sind. Eben die primitiven Formen ähneln der Fn3-Domäne am stärksten.

Mit Sicherheit werden weitere Beispiele quasi geraubter Module auftauchen. Nach unserer Zählung ist die Fn3-Domäne in etwa 2 Prozent aller Proteine von Tieren enthalten (bei 50 von 2500 bekannten Sequenzen, nicht eingerechnet die bei verschiedenen Spezies abgewandelten Formen des gleichen Proteins). Wir schätzen, daß etwa 25 Module ähnlich häufig wie Fn3 in Tierproteinen verbreitet sind. Mehr als 100 weitere kommen in mehr als einem Protein vor, aber weniger häufig als die erste Gruppe.

Die Identifizierung, Klassifizierung und phylogenetische Analyse dieser modularen Einheiten ist eine große Herausforderung. Die Forschung auf diesem Gebiet dürfte dazu beitragen, jegliche Aspekte der molekularen Evolution von Lebewesen besser zu verstehen.


Aus: Spektrum der Wissenschaft 12 / 1993, Seite 40
© Spektrum der Wissenschaft Verlagsgesellschaft mbH

Kennen Sie schon …

Spektrum - Die Woche – Die Urin-Revolution

Spektrum der Wissenschaft – Das Fundament der Physik

»Spektrum der Wissenschaft« berichtet über das Quantenfeldtheorie - Fundament der Physik. Außerdem im Heft: Hyperschallwaffen - Hintergründe eines neuen Wettrüstens, Geochemie - Wo Kohlendioxid zu Stein wird, Dingos - Evolutionäre Grenzgänger zwischen Wolf und Hund.

Spektrum - Die Woche – Die Frauen hinter der Mondlandung

In dieser Ausgabe widmen wir uns Bakterien, den Frauen hinter der Mondlandung und der Kunst, sich selbst zu vertrauen.

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.