Lexikon der Biochemie: Genomprojekt
Genomprojekt, Sammelbezeichnung für Projekte zur vollständigen Sequenzierung und Analyse der Genome von Mensch, Hefe und anderen Organismen. Tab. 1 zeigt die geschätzte Genomgröße verschiedener Organismen. Bis August 1998 war für 15 Mikroorganismen die Sequenzierung des gesamten Genoms abgeschlossen (Tab.2).
Caenorhabditis elegans diente dabei als Modellorganismus für die geplante vollständige Sequenzierung des menschlichen Genoms. Dieses Mitte der 80er Jahre initiierte große amerikanische Sequenzierprojekt, mit dem das Erbgut des Menschen entschlüsselt werden soll, wird als Humangenomprojekt bezeichnet. Bis Oktober 1998 wurden von Wissenschaftlern weltweit in der Datenbank GenBank (Tab. 3) über 175 × 106 Nucleotide von Human-DNA-Sequenzen veröffentlicht (das entspricht ungefähr 5% der Gesamtsequenz). Zum gleichen Zeitpunkt waren – basierend auf YACs (künstliche Hefechromosomen) – 30.181 menschliche Gene kartiert. Dies entspricht ungefähr der Hälfte aller menschlichen Gene, deren Anzahl auf 60.000-80.000 geschätzt wird. In den ersten Jahren des Projekts konzentrierten sich die Bemühungen auf die Entwicklung neuer, schnellerer und kosteneffizienterer Sequenzierungs- und Kartierungsmethoden. Dies ist z. B. mit der Einführung der YACs und neuerdings der BACs (künstliche Bakterienchromosomen) sowie von Nucleotidchips gelungen, so dass zur Zeit die Hoffnung besteht, dass das Humangenom sogar schon im Jahr 2003 -zwei Jahre früher als geplant – vollständig sequenziert und kartiert ist und die Budgetvorgaben eingehalten werden.
Die Probleme bei der Sequenzierung des Humangenoms bestehen vor allem darin, dass 96% der menschlichen genomischen DNA nicht aus Genen, sondern aus nichtcodierenden DNA-Sequenzen bestehen. Weiter wird die Ermittlung der Basensequenz der Gene kompliziert durch die Fragmentierung ihrer DNA in codierende Exons und nichtcodierende Introns. Im Zuge der Sequenzierung des bisher umfangreichsten Genoms (von Caenorhabditis elegans) hat man herausgefunden, dass sich für 92% der Introns die Exon/Intron-Grenzen voraussagen lassen. Geht man aber davon aus, dass ein durchschnittliches Gen von C.elegans aus fünf Exons besteht, dann sinkt die Wahrscheinlichkeit für eine korrekte Vorhersage aller fünf Exons auf 65,9%. Bei weiterer Berücksichtigung der Tatsache, dass die Termini nur zu 70 % ausgehend von den Basensequenzen der DNA nachweisbar sind, so lassen sich letztlich für C. elegans nur etwa 46% aller Gene korrekt vorhersagen. Für das menschliche Genom führen diese Betrachtungen bei Berücksichtigung des weitaus höheren Anteils nichtcodierender Sequenzen (C. elegans: 73%; Mensch: 96%) zu der Schlussforderung, dass eine Vorhersagbarkeit von 100 % nicht zu erreichen ist. Darüber hinaus zeigt die Existenz von unterschiedlich gespleißten mRNAs, dass eine eindeutige Identifizierung von Introns und Exons selbst im zellulären Bereich nicht möglich ist.
Tab. 1. Genomprojekt. Die Genomgröße verschiedener Organismen im Vergleich.
| |||
Mensch | 3.000 | 60.000-80.000 | |
Maus | 3.000 | 50.000-100.000 | |
Drosophila | 165 | 15.000-25.000 | |
Nematode | 100 | 11.800-13.800 | |
Hefe (Pilz) | 14 | 8.355-8.947 | |
E. coli (Bakterium) | 4,67 | 3.237 | |
H. influenza (Bakterium) | 1,8 | ||
M. genitalium (Bakterium) | 0,58 |
Tab. 2. Genomprojekt. Vollständig sequenzierte Genome.
| |||
Saccharomyces cerevisiae | 12,1 | 6.034 | |
Escherichia coli | 4,6 | 4.288 | |
Bacillus subtilis | 4,2 | ~4.000 | |
Synechocystis | 3,6 | 3.168 | |
Archaeoglobus fulgidus | 2,2 | 2.471 | |
Pyrobaculum aerophilum | 2,2 | – | |
Haemophilus influenza | 1,8 | 1.740 | |
Methanobacterium thermoautotrophicum | 1,8 | 1.855 | |
Helicobacter pylori | 1,7 | 1.590 | |
Methanococcus jannaschii | 1,7 | 1.692 | |
Aquifex aolicus | 1,5 | 1.508 | |
Borrelia burgdorferi | 1,3 | 863 | |
Treponema pallidum | 1,1 | 1.234 | |
Mycoplasma pneumoniae | 0,8 | 677 | |
Mycoplasma genitalium | 0,6 | 470 |
Tab. 3. Genomprojekt. Die Humangenomdaten können über diese Knoten abgefragt werden.
| ||||
USA (Hauptknoten) | GDB Human Genom Database John Hopkins University School of Medicine 2024 E. Monument Street, Suite 1-200 Baltimore, Maryland 21205-2100 USA | 1) 1-410-955-9705 2) 1-410-614-0434 3a) User Support and Registration: help@gdb.org 3b) Data Acquisition and Curation: data@gdb.org | http:gdbwww.gdb.org. | |
Australien | Mrs. Carolyn Bucholtz Australian National Genomic Information Service (ANGIS) Dept. Of Electrical Engineering Building J03 University of Sydney Sydney, NSW 2006 Australia | 1) und 2) 61-2-9351-2948 3) bucholtz@angis.su.oz.au | GDB Mirror Site ANGIS Web Server | |
Dr. Anthony P. Kyne The Walter and Eliza Hall Institute of Medical Research Royal Melbourne Hospital Campus Royal Parade Parkville Melbourne, Victoria 3050 Australia | 1) 61-3-9345-2586 2) 61-3-9347-0852 3) tony@wehi.edu.au | GDB Mirror Site WEHI (Walter and Eliza Hall Institute) Web Server | ||
Belgien | Mr. David Coornaert Belgian EMBnet Node Brussels Free Universities Computing Centre Departement of Molecular Biology Rue des Chevaux 67 B 1640 Rhode-St.-Genese | 1) 32-2-6509764 2) 32-2-6509767 3) dcoorna@dbm.ulb.ac.be | GDB Mirror site Belgian EMBnet Node | |
Deutschland | The Biocomputing Unit Abteilung für Molekularbiophysik Deutsches Krebsforschungszentrum (DKFZ) Im Neuenheimer Feld 280 69120 Heidelberg Deutschland | 1) 49-6221-42-2349 2) 49-6221-42-2333 3) gdb@dkfz-heidelberg.de | GDB Mirror Site German Cancer Research Center Web Server | |
Frankreich | Dr. Philippe Dessen INFOBIOGEN Service de bioinformatique 7, rue Guy Môquet – BP 8 94801 Villejuif Cedex France | 1) 33-1-49-59-52-41 2) 33-1-49-59-52-50 3) gdb@infobiogen.fr | GDB Mirror Site INFOBIOGEN Web Server | |
Großbritannien | UK HGMP Resource Centre Hinxton Cambridge CB10 1SB U. K. | 1) 44-1223-494520 2) 44-1223-494512 3) support@hgmp.mrc.ac.uk | GDB Mirror Site UK HGMP Resource Centre Web Server | |
Israel | Dr. Jaime Prilusky Bioinformatics Unit Weizmann Institute of Science 76100 Rehovot Israel | 1) 972-8-9343456 2) 972-8-9344113 3) Isprilus@weizmann.weizmann.ac.il | GDB Mirror Site Weizmann Institute Web Server | |
Italien | Mr. Gyorgy Simon Tigem – Telethon Institute of Genetics and Medicine Informatics Core Via Olgettina, 58 20132 Milan Italy | 1) 39-2-21-560-212 2) 39-2-21-560-220 3) simon@tigem.it | GDB Mirror Site Tigem Web Server | |
Dr. Luciano Melanesi Istituto Tecnologie Biomediche Avanzate L.I.T.A. – C.N.R. Via Fratelli Cervi, 93 20090 Segrate (MI) Italy | 1) 39-2-26422604 2) 39-2-26422770 3) melanesi@itba.mi.cnr.it | GDB Mirror Site ITBA Web Server | ||
Japan | GDB Japan Node Staff Japan Science and Technology Corporation (JST) 5-3, Yonban-cho Tokyo 102 Japan | 1) 81-3-5214-8491 2) 81-3-5214-8470 3) gdb-staff@gdbnet.ad.jp | GDB Mirror Site JICST Web Server | |
Niederlande | CAOS/CAMM Center Faculty of Science University of Nijmegen P.O. Box 9010 6500 GL Nijmegen The Netherlands | 1) 31-24-3653391 2) 31-24-3652877 3) post@caos.kun.nl | GDB Mirror Site CAOS/CAMM Centre Web Server | |
Schweden | GDB User Support Biomedical Centre Box 570 S-751 23 Uppsala Sweden | 1) 46-18-17-44-32 2) 46-18-52-68-49 3) help@gdb.embnet.se | GDB Mirror Site Biomedical Centre Web Server | |
Taiwan | National Health Research Institutes Department of Research Resources Division of Computer and Information 128 Yen-Chiu-Yuan Rd., Sec. 2 Taipei 115 Taiwan R.O.C. | 1) 886-2-26534401 x8223 2) 886-2-26513723 3) gdb@nhri.org.tw | GDB Mirror Site National Health Research Institutes Web Server |
Stand: Juli 1998.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.