Radebrechen im Idiom der Proteine
Kann man sich in einer Sprache verständlich machen, die man nicht versteht? Protein-Designer haben dieses Kunststück probiert und dabei erstaunlich gut gelernt, sich in der erst ansatzweise entschlüsselten Faltungssprache der Aminosäureketten auszudrücken: Sie können inzwischen Proteine entwerfen, die sich zu Knäueln mit vorgegebener Struktur aufwickeln.
Angenommen, Archäologen wollten die Schriftsprache einer ausgestorbenen Kultur entziffern, von der es nur noch einen Überlebenden gibt. Dieser könnte ihnen auf zwei verschiedene Arten helfen: Entweder schreibt er Anweisungen nieder und bestätigt, wenn die Wissenschaftler sie richtig entziffert und befolgt haben; oder er läßt sich seinerseits schriftliche Befehle erteilen und führt sie aus, sofern die Zeichen grammatisch korrekt verwendet wurden und für ihn einen Sinn ergeben.
Ähnlich ergeht es Biologen, welche die Faltungssprache der Proteine zu enträtseln versuchen – nämlich die Regeln, nach denen sich die lineare Kette der Aminosäurebausteine eines Eiweißstoffs zu einer dreidimensionalen Struktur verknäult, aufwickelt oder „faltet“, wie die Biologen sagen. Auch sie können einerseits versuchen, für eine vorliegende Sequenz die Struktur vorherzusagen (also die in der Abfolge implizit enthaltene Faltungsanweisung zu entschlüsseln), oder sich andererseits zum Ziel setzen, für eine gegebene Struktur eine Aminosäurekette zu entwerfen, die sich von selbst entsprechend zusammenlegt.
Die erste Aufgabe ist als Faltungsproblem wohlbekannt und beschäftigt seit Jahren Heerscharen von Wissenschaftlern – mich eingeschlossen –, ohne daß eine Lösung in Sicht wäre. Dagegen hat sich dem Designproblem erst neuerdings ein eher kleines Häuflein Unerschrockener zugewandt; denn es gehört schon einige Kühnheit – um nicht zu sagen Verwegenheit – dazu, sozusagen verständliche Texte in einer Formensprache verfassen zu wollen, von der man allenfalls die Anfangsgründe notdürftig beherrscht.
Doch der Mut scheint belohnt zu werden. Eine 1994 mit einem Geldpreis dotierte Designaufgabe wurde nach nur drei Jahren gelöst, und inzwischen gelingt es sogar schon Computern, neue Sequenzen mit bestimmten Faltungseigenschaften zu entwerfen. Außerdem haben gewitzte Designer eine Art Protein-Pidgin entwickelt: einen Grundwortschatz aus nur fünf Aminosäurebausteinen, der genügt, auch komplizierte Faltungsvorschriften auszudrücken.
Eine Herausforderung, die keine war
Noch in den achtziger Jahren galt das Designproblem als hoffnungslos schwierig. Eine gewisse Ermutigung schöpften die wenigen Pioniere, darunter Bill DeGrado und Lynne Regan bei der Firma Du Pont, einzig aus dem Umstand, daß die Proteinsprache voll von leeren Floskeln und bedeutungslosen Phrasen ist: Die Struktur eines Eiweißstoffs wird oft durch ein Viertel der Bausteine bereits festgelegt, während die übrigen Aminosäuren teils in Grenzen, teils sogar beliebig austauschbar sind. Die Designer rechneten sich deshalb gewisse Chancen aus, mit einem schnörkellosen, konzisen Text, in den sie das wenige, was sie von der Sprache verstanden, geballt einbauten, die Essenz ihrer Botschaft zu vermitteln.
Außerdem griffen sie auf das auch von der Natur exzessiv genutzte Baukastenprinzip zurück: Sie versuchten sich zuerst an einer einzelnen wendeltreppenartigen Struktur, dann an einem kleinen Protein mit zwei solchen Helices und schließlich an einem Vier-Helix-Bündel. Obwohl sie dabei Stück um Stück vorankamen, schienen sie von einem echten Verständnis der Grammatik, die sie beim Schreiben solcher Sequenzen benutzten, immer noch weit entfernt.
Um dieses Fehlen jeder tieferen Einsicht bloßzulegen, setzten George Rose und Trevor Creamer von der Medizinischen Fakultät der Washington University in St. Louis (Missouri) 1994 einen Geldpreis für die Erfüllung einer Designaufgabe aus. Gefordert wurde die Präsentation zweier Proteine, die verschiedene Strukturen annehmen, obwohl ihre Sequenzen zu 50 Prozent übereinstimmen. Da ein solches Paar in der Natur nicht existiert, kam dies der Aufgabe gleich, ein gegebenes Protein durch Austausch von höchstens der Hälfte seiner Bausteine in eine anders gefaltete Variante zu überführen. In die Sprach-Metapher übersetzt, könnte man das mit der Forderung vergleichen, diesen Artikel durch Ersetzen von höchstens 50 Prozent der Wörter in eine Reportage über ein Fußballspiel zu verwandeln.
Sofern sowohl die Ausgangs- als auch die Zielstruktur von je einem Viertel der Bausteine festgelegt würde, hatte man also aus der Ursprungssequenz jene 25 Prozent zu entfernen, die deren Struktur bestimmten, und jenes Viertel einzuführen, das die Zielstruktur determinierte. Im ungünstigsten Fall – wenn sich beide Teilmengen nicht überschnitten – würde das genau 50 Prozent Austausch erfordern, und die Aufgabe wäre nur lösbar, wenn man die ausschlaggebenden Positionen vollständig und korrekt identifizierte. Daß dafür die Kenntnis der Protein-Sprache noch längst nicht ausreiche – ebendies wollten Rose und Creamer mit ihrem 1000-Dollar-Preis, den sie nach dem Schweizer Alchemisten und Arzt Paracelsus benannten, vor aller Welt dokumentieren.
Doch die Protein-Designer kamen mit ihren Schreibübungen frappierend schnell voran, und so konnten bereits im Sommer letzten Jahres Lynne Regan, mittlerweile an der Yale-Universität in New Haven (Connecticut), und ihre Mitarbeiter das Preisgeld einstreichen. Sie hatten die überwiegend aus wellblechartigen Beta-Faltblättern bestehende B1-Domäne des Immunoglobulin bindenden Proteins G durch Austausch von 28 der 56 Aminosäuren in eine Variante des DNA-bindenden Proteins ROP (repressor of primer) umgewandelt, das zwei parallele Alpha-Helices bildet und sich mit seinesgleichen zu einem Vier-Helix-Bündel zusammenlagert („Nature Structural Biology“, Band 4, Seiten 548 bis 552, Juli 1997; Bild 1).
Computer als Protein-Designer
Während diese Leistung noch auf wohlüberlegten Entscheidungen der Forscher über jede einzelne Aminosäure sowie nicht zuletzt auf zehnjähriger Erfahrung im Design von Helix-Bündeln und im Manipulieren der ROP-Struktur beruhte, könnte der Mensch das Entwerfen vielleicht schon bald Maschinen überlassen. Kürzlich präsentierten Bassil Dahiyat und Stephen Mayo vom California Institute of Technology in Pasadena nämlich ihren verblüfften Fachkollegen das erste von einem Computer kreierte Protein („Science“, Band 278, Seiten 82 bis 87). Als Entwurfsziel hatten die Forscher dem Programm die Strukturdaten eines fingerförmigen Gebildes vorgegeben, das in vielen DNA-bindenden Proteinen vorkommt (siehe Spektrum der Wissenschaft, April 1993, Seiten 54 bis 61). Diese Zinkfinger-Domäne wird in der Natur durch ein gebundenes Zink-Ion stabilisiert; doch die Aufgabe an den Computer war anspruchsvoller: Er sollte eine 28 Aminosäuren lange Sequenz finden, die auch ohne Metall die geforderte Struktur annähme. Einen solchen „Zinkfinger ohne Zink“ hatte zuvor schon die Arbeitsgruppe von Barbara Imperiali (ebenfalls am California Institute of Technology) konstruiert, dabei aber auch zwei Aminosäurebausteine verwendet, die nicht in der Natur vorkommen („Science“, Band 271, Seite 342, 1996).
Dahiyat und Mayo verbanden die Erkenntnisse aus diesem ersten Entwurf eines künstlichen Zinkfingers mit der Erfahrung, welche die kleine Clique der Protein-Designer in knapp zehn Jahren zusammengetragen hatte, zu einem Algorithmus, der für 2¥1027 verschiedene Sequenzen und jeweils mehrere Anordnungen der Seitenketten ermittelte, ob die angestrebte Zielstruktur für sie energetisch günstig wäre.
Das mit massivem Rechenaufwand aus dieser astronomischen Zahl von Möglichkeiten ausgefilterte Protein, das die Kalifornier FSD-1 (full sequence design 1) nannten, zeigt wenig Ähnlichkeit mit bekannten Sequenzen. So stimmt es nur in sechs Positionen mit dem natürlichen Zinkfinger überein. Es handelt sich also tatsächlich um ein künstliches Molekül und nicht um eine bloße Variante des biologischen Vorbildes. Den Nachweis, daß es sich in Lösung auch ohne Zink in der gewünschten Weise faltet, führten die Forscher durch Strukturanalyse mittels kernmagnetischer Resonanzspektroskopie (NMR).
FSD-1 ist das kleinste bisher bekannte Protein überhaupt, das ohne Unterstützung durch Metall-Ionen oder Schwefelbrücken eine komplexe Struktur mit all ihren typischen Feinheiten annehmen kann. Man darf gespannt sein, welche wundersamen Sequenzen die Computer in Pasadena als nächstes auswerfen; doch der gewaltige Rechenaufwand, der exponentiell mit der Länge der Aminosäurekette zunimmt, dürfte ihren Entwürfen enge Grenzen setzen.
Ein Ausweg zeichnet sich freilich schon ab. Nach dem Motto „Weniger ist mehr“ machten sich David Baker und seine Mitarbeiter an der Universität von Washington in Seattle daran, die Sequenz der SH3-Domäne – einer Baueinheit in vielen Proteinen, die der Signalübertragung von Zelle zu Zelle dienen – zu vereinfachen („Nature Structural Biology“, Band 4, Heft 10, Oktober 1997). Könnte man dieselbe Struktur nicht vielleicht auch mit wesentlich weniger als den 20 natürlichen Aminosäuren realisieren? Ähnlich wie Dahiyat und Mayo überprüften Bakers Mitarbeiter eine große Zahl von Abwandlungen des biologischen Vorbilds, wobei sie allerdings darauf achteten, so viele Positionen wie möglich mit einer von nur fünf Aminosäuren (Isoleucin, Lysin, Asparaginsäure, Alanin und Glycin) zu besetzen. Dies vereinfachte die Puzzelei derart, daß kein Supercomputer mehr nötig war und die geeigneten Ketten experimentell ausgewählt werden konnten.
Dabei nutzten die Wissenschaftler die Fähigkeit der SH3-Domäne, bestimmte Moleküle zu binden. Dieselben Moleküle verwendeten sie gleichsam als Köder, um aus einem Pool vieler verschiedener Sequenzen nur diejenigen herauszufischen, deren Bindungseigenschaften mit denen der SH3-Domäne übereinstimmten. Dabei stellten sie fest, daß sich – abgesehen von dem aktiven Zentrum, dessen Aufbau unverändert bleiben muß, wenn die Bindungsfähigkeit erhalten bleiben soll – 95 Prozent der Aminosäuren durch eine aus dem genannten Fünfersortiment ersetzen ließen. Insgesamt enthielt das vereinfachte Protein nur noch 14 verschiedene Aminosäuren und stimmte lediglich in 51 Prozent der Positionen mit der Ausgangssequenz überein; dennoch stand es in Bindungsstärke wie Faltungsgeschwindigkeit der natürlichen Domäne nicht nach.
Protein-Designer vermögen sich inzwischen also recht geschickt in der Sprache der Eiweißstoffe auszudrücken. Sie haben gelernt, auf welche Wörter es ankommt und welche weniger wichtig oder sogar beliebig austauschbar sind. Nun, da sie die Grundregeln der Grammatik beherrschen, sollten sie auch die Feinheiten in absehbarer Zeit herausbekommen. Schon der jetzt erreichte Kenntnisstand wird immense praktische Bedeutung für den Entwurf neuartiger Proteinmoleküle – etwa für Arzneimittel – haben. Auch diejenigen Forscher, die den umgekehrten Ansatz verfolgen und aus der Abfolge der Aminosäuren die Struktur und Funktion des zugehörigen Proteins abzuleiten suchen, sollten davon profitieren. Da mit der zunehmenden Entschlüsselung vollständiger Genome die Daten über Proteinsequenzen inzwischen zu einer wahren Flut anschwellen, wird das Erlernen der Protein-Sprache jedenfalls immer dringlicher.
Aus: Spektrum der Wissenschaft 2 / 1998, Seite 25
© Spektrum der Wissenschaft Verlagsgesellschaft mbH
Schreiben Sie uns!
Beitrag schreiben