Erbgut-Spielerei: Forscher schreiben ein ganzes Buch in DNA
Bislang gaben sich Forscherteams noch mit kleineren Auszügen aus der Literatur zufrieden – so bastelte Genforschungspionier Craig Venter ein Joyce-Zitat in die DNA seines synthetischen Bakteriums. Doch dank der Fortschritte im Umgang mit dem Erbgutmolekül darfs mittlerweile auch ein bisschen mehr sein: Ein ganzes Buch, komplett mit elf jpg-Bildern und einem nicht näher spezifizierten JavaScript-Programm, haben Forscher um George Church vom Wyss Institute der Harvard University und Kollegen in Form einer Erbgutsequenz kodiert.
Dazu übersetzten sie den knapp 54 000 Wörter langen Fließtext ins html-Format und erhielten so inklusive der Bebilderung und dem Programm einen digitalen Datensatz von 5,27 Megabits Größe. Diesen kodierten sie wiederum nach einem einfachen Schema als DNA: Jede "1" der Ursprungsdaten sollte durch die Nukleotide G oder T repräsentiert werden, jede "0" durch die verbleibenden beiden Basen A oder C. Theoretisch könnte die Information noch dichter gepackt werden, allerdings lassen sich manche Abfolgen ein und desselben Buchstabens nur unter Schwierigkeiten herstellen. Die von den Wissenschaftlern eingeführte Variation umgeht dieses Problem.
Darüber hinaus fertigten sie anstelle eines einzigen langen DNA-Fadens über 54 000 kleine Abschnitte an, die neben reinen Steuersequenzen immer nur einen Teil des Texts umfassten. Hinzu kam jeweils noch eine 19 Bit lange Adresssequenz, aus der beim Auslesen des DNA-Kodes die Position des Schnipsels im Gesamtzusammenhang hervorgeht.
Der Vollständigkeit halber schrieben die Wissenschaftler um Church den Text nicht nur, sondern lasen ihn anschließend auch wieder aus. Dabei erhielten sie lediglich zehn falsche Bits unter 5,27 Millionen. Diese geringe Fehlerquote verdankt sich der Tatsache, dass sich DNA einfach vervielfältigen lässt, so dass identische Stränge gleich in zigfacher Ausführung vorlagen.
Sowohl den "Schreibvorgang", also das Synthetisieren der DNA-Abschnitte, als auch das Lesen, also Sequenzieren, besorgten die Forscher mit Hilfe von Standardequipment, wie sie mittlerweile zum Alltag der meisten gentechnischen Labors gehört. Insofern handelt es sich bei der Studie des Forscherteams auch eher um eine Fleiß- als um eine Forschungsarbeit.
Dennoch möchte die Gruppe mit ihrer Arbeit auch den Wert der DNA als technischen Datenspeicher unterstreichen. Dazu führen sie ein eindrucksvolles Rechenexempel an: Kein anderer in Erprobung befindlicher Speicher weise eine derart hohe Datendichte auf wie natürliches Erbgut. Mit ihrem Verfahren lassen sich laut Church und Kollegen in einem Block von einem Millimeter Kantenlänge ganze 5,5 Petabits an Daten speichern. In Maßeinheiten heutiger Festplatten ausgedrückt sind dies rund 721 000 Gigabyte.
Davon abgesehen habe DNA noch eine Reihe weiterer Vorteile. So zeigten die Erfolge beim Lesen uralter DNA, dass selbst nach mehreren tausend Jahren noch Erbgut entziffert werden könnte. Und da DNA zufällig auch noch die Grundlage biologischen Lebens sei, könne man damit rechnen, dass auch künftige Generationen über Mittel und Wege verfügen werden, um diesen Kode auszulesen.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.