Wandelbarkeit des genetischen Codes - endgültiger Sturz eines Dogmas
Nun steht es definitiv fest: Die genetische Sprache des Lebens ist nicht allgemeingültig; Hefepilze der Gattung Candida interpretieren ein wichtiges Wort im Text der Erbinformation anders als das Gros der Organismen. Wie konnte es zu dieser Eigentümlichkeit kommen?
Francis H. Crick, der 1953 zusammen mit James D. Watson die Struktur der Erbsubstanz DNA aufgeklärt hat (wofür beide 1962 den Medizin-Nobelpreis erhielten), war noch nie verlegen um brillante Ideen. So vermutete er 1957, daß der genetische Code, der die Abfolge der Basen-Bausteine der DNA mit jener der Aminosäuren in den Proteinen verbindet, sozusagen ohne Interpunktion auskomme. Die "Wörter" (Codons), die aus jeweils drei "Buchstaben" (Basen) bestehen sollten, müßten demnach so beschaffen sein, daß bei Verschiebung um einen Buchstaben nur sinnlose Dreierkombinationen (Tripletts) entstünden, die keiner Aminosäure zugeordnet wären; wenn al-so zum Beispiel CAT und GAA Codons wären, dürften AAC, ACA, ATG und TGA keine sein (die Buchstaben stehen für die vier Basen Cytosin, Thymin, Adenin und Guanin, die das genetische Alphabet ausmachen).
Wie viele der 64 (4×4×4) theoretisch möglichen Tripletts könnten, so fragte sich Crick, unter dieser Bedingung noch verwendet werden? Wie er zu seiner eigenen Überraschung herausfand, waren es 20 – gerade so viele, wie es Aminosäuren in den üblichen Proteinen gibt.
In der ersten Hälfte der sechziger Jahre stellte sich jedoch heraus, daß der genetische Code nicht so elegant konstruiert ist wie Cricks Theorie. Tatsächlich hat jedes Triplett eine Bedeutung, wobei allerdings oft mehrere für dieselbe Aminosäure codieren (die Base in der dritten Position spielt meist keine Rolle). Wenn man das Leseraster (das beim Erkennen eines sogenannten Startcodons festgelegt wird, was Crick 1957 noch nicht wissen konnte) um ein Nucleotid verschiebt, ergeben sich also durchaus Aminosäuresequenzen, wenngleich völlig falsche.
Bei aller mangelnden Eleganz schien dieser Code aber immerhin universell zu sein. Am Darmbakterium Escherichia coli ermittelt, erwies er sich, wie Stichproben ergaben, auch für Viren, Pflanzen und den Menschen als gültig. Wiederum lieferte Crick eine plausible theoretische Erklärung: Nachdem der gemeinsame Vorfahr aller heute lebenden Organismen (Progenot) einen funktionierenden Code entwickelt hatte und seine Proteine nach dieser Anweisung produzierte, wäre jegliche Abwandlung verderblich gewesen, weil sie in unkontrollierter Weise viele Proteine auf einmal verändert hätte.
Auch diesmal erwies sich die Natur jedoch als nicht unbedingt theoriekonform. So fand man Anfang der achtzi-ger Jahre etliche Abweichungen vom angeblich universellen Code in den Mitochondrien. Diese Organellen erzeugen in den Eukaryontenzellen (also solchen mit echtem Kern) die lebensnotwendi-ge Energie. Mit Ausnahme der grünen Pflanzen existieren bei den Mitochondrien der Eukaryonten so viele Code-Varianten, daß Wissenschaftler sie inzwischen dazu benutzen, Verwandtschafts- und Abstammungsverhältnisse der Arten zu untersuchen.
Nun ist die eigene Erbsubstanz der Mitochondrien freilich ein kurioser Atavismus. Vermutlich stammen diese Organellen von Bakterien ab, die vor Jahrmilliarden mit dem gemeinsamen Vorfahren aller heutigen Eukaryonten eine Symbiose eingingen und dann völlig vereinnahmt wurden. Sie enthalten inzwischen nur noch die Bauanleitung für rund ein Dutzend Proteine und müssen Hunderte importieren, die im Genom im Zellkern verschlüsselt sind. Bei so stark eingeschränkter genetischer Ausstattung ist das Umdefinieren eines Codons weniger riskant und der Evolutionsdruck zur Beibehaltung der universellen genetischen Sprache somit geringer.
Doch 1985 entdeckte man besondere Dialekte auch bei Pantoffeltierchen (Paramecium) sowie bei Einzellern der Gattungen Mycoplasma und Tetrahymena. In all diesen Fällen werden Codons, die normalerweise ein Stopp-Signal darstellen, als Verschlüsselungen einer der 20 Standard-Aminosäuren gelesen.
Drei Jahre später fand die Arbeitsgruppe von August Böck an der Universität München heraus, daß selbst in E. coli das Stopp-Signal UGA in bestimmten Fällen für die Nicht-Standard-Aminosäure Selenocystein codiert. (Üblicherweise bezieht man die Codons auf die Boten-RNA, in welche die Erbinformation abgeschrieben und von der sie dann in das entsprechende Protein übersetzt wird; sie enthält statt Thymin die Base Uracil.) Der Einbau von Selenocystein in Proteine ist allerdings für die Zelle mit erheblichem Mehraufwand verbunden und entsprechend selten.
Konnte man all dies noch als weitgehend unbedeutende Spezialfälle abtun, die das Dogma von der Universalität des genetischen Codes nicht ernsthaft in Frage stellten, tangierten es Befunde von T. Yokogawa und seinen Kollegen an der Technischen Universität Tokio im Jahre 1989 jedoch im Kern. Danach schien der Hefepilz Candida cylindracea das Codon CUG als Serin statt als Leucin zu interpretieren.
Was die japanischen Wissenschaftler vor sechs Jahren nur erschlossen, konnten Manuel A.S. Santos und Mick F. Tuite von der Universität von Kent in Canterbury bei der nahe verwandten Art Candida albicans nun direkt beweisen. Dazu konstruierten sie ein Gen mit zwei künstlich eingesetzten CUG-Codons und ließen es von dem Pilz übersetzen. Die Sequenzierung und massenspektrometrische Untersuchung des erzeugten Proteins ergab, daß CUG tatsächlich durchweg als Serin, das sehr ähnliche CUU dagegen in der üblichen Weise als Leucin aufgefaßt wird ("Nucleic Acids Research", Band 23, Heft 9, Seiten 1481 bis 1486). Ähnliches zeigten H. Sugiyama und seine Kollegen auch für Candida maltosa ("Yeast", Band 11, Heft 1, Seiten 43 bis 52).
Dies liefert den endgültigen Beweis, daß der genetische Code auch in der genomischen DNA von Eukaryonten nicht einheitlich ist und sich sogar in evolutionsbiologisch junger Vergangenheit noch gewandelt hat. Man schätzt aufgrund der Verbreitung der abweichenden Lesart für CUG über einen wesentlichen Teil der Gattung Candida, daß die Uminterpretation vor etwa 150 Millionen Jahren stattgefunden haben muß. Untersuchungen der Arbeitsgruppen von Tuite und Yokogawa an der Transfer-RNA (tRNA), die in Candida albicans für die unkonventionelle Lesart des CUG-Codons sorgt, legen sogar nahe, daß der Prozeß noch nicht beendet ist. Eine tRNA paßt mit dem einen Ende zu einem bestimmten Codon und trägt am anderen die einzubauende Aminosäure. Diejenige für CUG in Candida-Arten weist zwar einige Charakteristika von Serin-tRNAs auf, hat aber andere mit typischen Leucin-tRNAs gemeinsam (Bild).
Wie kann es in der Evolution zu ei-ner Abwandlung des genetischen Codes kommen? Diese Frage ist ganz und gar nicht trivial. Fände die Umstellung schlagartig statt, wäre sie für den betroffenen Organismus mit Sicherheit tödlich, weil sich bei Tausenden von Proteinen gleichzeitig die Zusammensetzung ändern würde. Darum haben Syozo Osawa von der Universität Nagoya und Thomas H. Jukes von der Universität von Kalifornien in Berkeley 1992 ein nicht benutztes Codon als Zwischenstufe postuliert. Ihre Hypothese beruht darauf, daß bei doppelsträngiger genomischer DNA der relative Anteil der beiden Basenpaarungen GC und AT zwischen verschiedenen Lebewesen deutlich variiert; in Bakterien zum Beispiel bewegt sich der GC-Gehalt zwischen 25 und 74 Prozent.
Nach Osawa und Jukes wechselten sich bei den Vorfahren der Candida-Arten Phasen eines Evolutionsdrucks in Richtung AT-Paarung mit solchen zugunsten von CG ab. Da vier Codons für Leucin stehen (alle, die mit CU beginnen), könnte der Organismus in Zeiten, als CG benachteiligt war, das sowieso schon relativ seltene CUG-Codon ganz verloren haben. Es wäre dann ein nicht zugeordnetes Triplett geworden, für das es keine tRNA mehr gab. Sobald der Evolutionsdruck aber wieder GC begünstigte, hätte das Codon neu vergeben werden können und wäre dann mit Serin belegt worden.
Dennis Schultz und Michael Yarus von der Universität von Colorado in Boulder halten den völligen Verlust eines Codons und die anschließende Wiedereinführung allerdings für unrealistisch. Sie stellten deshalb 1994 die These auf, daß die Uminterpretation über eine Phase der Doppeldeutigkeit des betreffenden Codons ablaufe.
Bisher läßt sich nicht definitiv entscheiden, welche der beiden Vermutungen zutrifft. Nach Santos und Tuite sind in einigen Bakterien mit besonders hohem oder niedrigem Gehalt an GC offenbar tatsächlich einzelne Codons nicht zugeordnet, was die Theorie von Osa-wa und Jukes stützt. Andererseits haben selbst einzellige Eukaryonten wie Candida ein wesentlich komplexeres Genom, dessen GC-Gehalt schon innerhalb eines Chromosoms erheblich variiert. Unter diesen Umständen scheint es unwahrscheinlich, daß durch Verschiebung des GC-Anteils im gesamten Erbgut ein Codon völlig verlorengehen könnte. Die Doppeldeutigkeits-Theorie von Schultz und Yarus paßt zudem besser mit den erwähnten strukturellen Besonderheiten der tRNA für das CUG-Serin zusammen.
Diese Überlegungen machen auch einen wesentlichen Vorteil des realen genetischen Codes gegenüber dem seinerzeit von Crick erdachten deutlich. Seine hochgradige Redundanz erlaubt Veränderungen in der Genstruktur, zum Beispiel bezüglich des GC-Gehalts, die oh-ne Auswirkungen auf die codierten Proteine bleiben. Viele Mutationen ändern das Genprodukt gar nicht, und die übrigen bewirken den Austausch einer Aminosäure. Im interpunktionsfreien Code hingegen würde nicht nur jede Mutation auf das Protein durchschlagen, sondern es entstünden auch in 70 Prozent der Fälle sinnlose Codons, was dem völligen Wegfall einer Aminosäure entspräche; die anderen Mutationen hätten allesamt den Austausch einer Aminosäure zur Folge.
Mag die Evolution genetischer Dialekte für das Leben vorteilhaft gewesen sein, so ist sie für Gentechniker jedenfalls ein Ärgernis. Möchten sie ein menschliches Protein für medizinische Zwecke von einem Mikroorganismus herstellen lassen, so müssen sie sich inskünftig erst vergewissern, daß ihr Helfer bei der Proteinbiosynthese auch den gängigen Code verwendet. Das für diesen Zweck am häufigsten eingespannte E. coli erfüllt diese Bedingung zwar, doch bei den meisten anderen Mikroorganismen weiß man das bisher nicht sicher.
Im übrigen können sich selbst bei formal identischem Code Lesefehler einschleichen, wenn die Vorlieben im Gebrauch synonymer Codons verschieden sind. Kommt in dem eingeschleusten Gen eines häufig vor, das der Wirts-organismus kaum benutzt, so kann der Nachschub an der betreffenden tRNA knapp werden; der Einbau einer falschen Aminosäure oder eine Verschiebung des Leserasters wäre die Folge.
Schon 1993 warnten Santos und Tuite vor solchen Lesefehlern in rekombinanten Proteinen. Massenspektrometrische Verfahren erlauben heute, selbst eine einzelne falsch eingebaute Aminosäure zu erkennen. Sie wären somit zur routinemäßigen Qualitätskontrolle geeignet – und eine solche sollte wohl auch bei jedem gentechnisch hergestellten Protein durchgeführt werden; denn darauf, daß eine Bakterienzelle ein menschliches Gen so liest, wie es gemeint ist, kann man sich eben nicht immer verlassen.
Aus: Spektrum der Wissenschaft 11 / 1995, Seite 16
© Spektrum der Wissenschaft Verlagsgesellschaft mbH
Schreiben Sie uns!
Beitrag schreiben