Direkt zum Inhalt

Sequenzvergleich: Viele Fehler in öffentlichen Gendatenbanken?

Vergleichende Genanalysen stehen und fallen mit der Qualität und dem sorgfältigen Umgang mit den bereits sequenzierten Daten. Daran mangelt es aber womöglich.

Nicht wenige Schlussfolgerungen aus vergleichenden Gensequenzanalysen könnten falsch sein, warnen Forscher der Johns Hopkins University, wenn die zu Grunde gelegten Gendaten zu sorglos interpretiert werden. Denn tatsächlich seien viele Sequenzen in Gendatenbanken nicht fehlerfrei – dienen sie als Grundlage von computergestützten Sequenzvergleichen, so könnten sich diese Fehler in immer neuen Datenbankeinträgen fortschreiben.

Die Wissenschaftler hatten zunächst damit begonnen, eindeutige Kontaminationen durch Bakterien- und Viren-DNA-Sequenzabschnitte in den öffentlich zugänglichen Datenbanksequenzen von Pflanzen und Tierspezies aufzuspüren. Tatsächlich zeigte sich dabei, dass nicht wenige der veröffentlichen Sequenzen nicht ordentlich bereinigt waren. Andersherum gab es sogar viele Hinweise auf Abschnitte von Wirbeltiersequenzen aus Kühen und Schafen im veröffentlichten Bakteriengenom des Gonorrhoe-Erregers Neisseria gonorrhoeae.

Tatsächlich sind solche vermeintlichen Genbeimischungen von Fremdarten fast nie ein Hinweis darauf, dass Arten tatsächlich Genmaterial ausgetauscht haben. Viel häufiger schleichen sie sich als Fehler bei dem automatisierten, computergestützten Prozess ein, bei dem aus mehreren analysierten Sequenzabschnitten einer Art ein endgültiges, typisches Genom der Spezies zusammengestrickt wird, wobei auch eindeutige Kontaminationen herausgerechnet werden. Experten wissen um diese möglichen Fehler und können sie mit verschiedenen Algorithmen ausschließen – tatsächlich komme es aber wohl gelegentlich vor, dass vorläufige Versionen mit endgültigen verwechselt werden oder der notwendige Prüfprozess nicht gründlich genug erledigt wird, befürchten die Wissenschaftler mit Blick auf ihr wenig erfreuliches Experiment.

Dies müssten alle Forscher im Blick haben, bevor sie sich auf frei zugängliche Gensequenz-Datenbaken zu sehr verlassen. Andernfalls sei es gut möglich, dass Fehler immer weitere Fehler nach sich ziehen. Gerade bei den vielen neuen Veröffentlichungen im Bereich des boomenden Forschungsfelds der Mikrobiomik könne das zum Problem werden.

  • Quellen
PeerJ, im Druck.

Schreiben Sie uns!

Beitrag schreiben

Wir freuen uns über Ihre Beiträge zu unseren Artikeln und wünschen Ihnen viel Spaß beim Gedankenaustausch auf unseren Seiten! Bitte beachten Sie dabei unsere Kommentarrichtlinien.

Tragen Sie bitte nur Relevantes zum Thema des jeweiligen Artikels vor, und wahren Sie einen respektvollen Umgangston. Die Redaktion behält sich vor, Zuschriften nicht zu veröffentlichen und Ihre Kommentare redaktionell zu bearbeiten. Die Zuschriften können daher leider nicht immer sofort veröffentlicht werden. Bitte geben Sie einen Namen an und Ihren Zuschriften stets eine aussagekräftige Überschrift, damit bei Onlinediskussionen andere Teilnehmende sich leichter auf Ihre Beiträge beziehen können. Ausgewählte Zuschriften können ohne separate Rücksprache auch in unseren gedruckten und digitalen Magazinen veröffentlicht werden. Vielen Dank!

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.