Genealogie: Das Problem der Personenrekonstruktion
Wer selbst etwas Ahnenforschung betreibt, kennt das Problem. Die Einträge in alten Kirchenbüchern zu ein und derselben Person können so stark variieren, dass für eine eindeutige Identifikation kriminalistischer Spürsinn gefragt ist. Welchen Problemen sich die Autoren des Artikels "Der Fall Johann F." in SdW 7/2009 gegenübersahen, beschreiben sie mit folgendem Beispiel.
(Dieser ergänzende Text ist nur online verfügbar.)
(Dieser ergänzende Text ist nur online verfügbar.)
Die handschriftlichen Originaleinträge in die alten Kirchenbücher sind oft nur schwer entzifferbar. Zwar wurden Werkzeuge entwickelt, mit denen die quellentreue Erfassung in die im Artikel beschriebene historische Bevölkerungsdatenbank effizient und damit in einem zeitlich annehmbaren Rahmen möglich ist – ein Verfahren, das sich weltweit in allen christlichen Kirchen mit jahrhundertelanger Pfarrmatrikelführung einsetzen lässt.
Bevor jedoch aus Millionen Datensätzen Ahnenreihen über bis zu zwölf Generationen oder gar Stammbäume mit Hunderten von Ahnen und Verwandten per Mausklick erstellt werden können, bedarf es mehr: neu zu entwickelnder intelligenter Software, die eine sichere Zuordnung verschiedener Einzeleinträge zu einer bestimmten Person erlaubt. Forschungsansätze und -abläufe der Genealogie müssen also umgesetzt werden in automatisierte Such- und Abfragealgorithmen, da eine Ordnung des gesamten Datenbestandes in einzelne Biographien manuell mit vernünftigem Aufwand nicht zu bewältigen ist.
Ging und geht es bei konventioneller Genealogie schon wegen des Forschungsaufwandes hauptsächlich darum, die Kerndaten (Taufe, Trauung und Beerdigung) einer Person zu ermitteln, und dann Generation für Generation aneinander zu fügen (mit gelegentlicher Ausforschung der Geschwister, Onkeln und Tanten in der näheren Vergangenheit), so kann die moderne datenbankgestützte Genealogie jede Beschränkung aufheben. Das Vorkommen einer Person in den Kirchenbucheinträgen ist nämlich nicht auf die Einträge der Kerndaten reduziert. Vielmehr finden wir die meisten Menschen vielfach genannt und zwar als Eltern von Kindern bei deren Taufe oder deren Heirat, als Taufpate, als Trauzeuge, gelegentlich sogar als Großvater oder Großmutter.
Das Zusammenführen aller unabhängig voneinander erstellten und einzeln in der Datenbank erfassten Einträge zu einer bestimmten Person – die so genannte Personenrekonstruktion – ist ein wichtiger Schritt hin zum automatisierten Stammbaum. Das Problem liegt aber auch hier, wie so oft, im Detail. Die Matrikelschreiber haben über die Jahrhunderte hinweg die Freiheiten des gesprochenen und geschriebenen Dialektes ebenso genutzt, wie sie die für Datenbanken eigentlich notwendige Eindeutigkeit der Schilderung von örtlich klaren Sachverhalten außer Acht gelassen haben. Es handelt sich aus Sicht der Informatik um "unscharfe Daten".
Illustriert wird diese Problematik exemplarisch anhand der Graphik zu einigen ausgewählten Daten eines Andreas Gräz, der im 18. Jahrhundert am Unterlauf des Inns lebte(siehe Bild)). Er wurde 1708 in der Pfarrei Neukirchen am Inn geboren und heiratete auf den Mautnerhof in der Nachbarpfarrei Dommelstadl, durch Eheschließung mit der Witwe des Vorbesitzers. Nach deren Tod nur drei Jahre später heiratete der nunmehrige Witwer und Hofbesitzer erneut. Aus der zweiten Ehe gingen fünf Kinder hervor, wovon zwei frühzeitig verstarben und eines noch zu Lebzeiten des Vaters heiratete. Andreas Gräz war vielfach Pate und Zeuge für Familien vornehmlich der Nachbarschaft und für die weitschichtigere Verwandtschaft. Im Jahr 1790 verstarb er 81jährig.
Allein der Ortsname Dommelstadl kommt in den dargestellten Einträgen in sechs Dialekt- beziehungsweise Schreibvarianten vor: Dommelstadl, Domelstadl, Dumelstadl, Dumlstadl, Tumelstadl, Dumenstadl. Wie schwierig die eindeutige Zuordnung von Angaben zu Datenfeldern einer Datenbank ist, zeigt die Verwendung des Hofnamens, eine meist vom Familiennamen eines historisch bemerkenswerten Vorbesitzers abgeleitete Bezeichnung eines bäuerlichen Anwesens. Im vorliegenden Fall war der Bauer auf diesem Hof an einer wichtigen Wegekreuzung in der Grafschaft Neuburg in früher Zeit wohl mit der Erhebung der Maut (Zoll) betraut gewesen. Diese wichtige Funktion prägte den Hofnamen "Mautnerhof", der noch heute existiert. Die Kirchenbuchführer verwendeten diese Bezeichnung als echten Hofnamen, genauso aber als Ortsangabe, als Beruf oder gar als Familiennamen. Die beiden frühzeitig gestorbenen Kinder des Andreas Gräz beispielsweise sind über eine Abfrage nach dem Familiennamen Gräz (inklusive dessen Schreibvarianten) nicht ermittelbar, da sie unter dem als Familiennamen verwendeten Hofnamen "Mautner" ins Beerdigungsbuch eingetragen worden sind.
Erst wenn die algorithmische Herausforderung des sicheren Umgangs mit unscharfen Daten und mit semantisch unterschiedlichen Bedeutungen eines Begriffs in den Einträgen bewältigt ist, kann eine automatische Zusammenführung solcher Personendaten erfolgreich ablaufen.
Eine möglichst lückenlose Personenrekonstruktion ist aber Voraussetzung für die automatisierte Familien- und damit Stammbaumrekonstruktion. Denn erst die in den Einträgen angegebenen Bezugspersonen wie Eltern, Ehepartner und Kinder erlauben die Verbindung einer Einzelperson zu ihren Ahnen, Lebenspartnern, Geschwistern und Nachkommen.<<
Bevor jedoch aus Millionen Datensätzen Ahnenreihen über bis zu zwölf Generationen oder gar Stammbäume mit Hunderten von Ahnen und Verwandten per Mausklick erstellt werden können, bedarf es mehr: neu zu entwickelnder intelligenter Software, die eine sichere Zuordnung verschiedener Einzeleinträge zu einer bestimmten Person erlaubt. Forschungsansätze und -abläufe der Genealogie müssen also umgesetzt werden in automatisierte Such- und Abfragealgorithmen, da eine Ordnung des gesamten Datenbestandes in einzelne Biographien manuell mit vernünftigem Aufwand nicht zu bewältigen ist.
Ging und geht es bei konventioneller Genealogie schon wegen des Forschungsaufwandes hauptsächlich darum, die Kerndaten (Taufe, Trauung und Beerdigung) einer Person zu ermitteln, und dann Generation für Generation aneinander zu fügen (mit gelegentlicher Ausforschung der Geschwister, Onkeln und Tanten in der näheren Vergangenheit), so kann die moderne datenbankgestützte Genealogie jede Beschränkung aufheben. Das Vorkommen einer Person in den Kirchenbucheinträgen ist nämlich nicht auf die Einträge der Kerndaten reduziert. Vielmehr finden wir die meisten Menschen vielfach genannt und zwar als Eltern von Kindern bei deren Taufe oder deren Heirat, als Taufpate, als Trauzeuge, gelegentlich sogar als Großvater oder Großmutter.
Das Zusammenführen aller unabhängig voneinander erstellten und einzeln in der Datenbank erfassten Einträge zu einer bestimmten Person – die so genannte Personenrekonstruktion – ist ein wichtiger Schritt hin zum automatisierten Stammbaum. Das Problem liegt aber auch hier, wie so oft, im Detail. Die Matrikelschreiber haben über die Jahrhunderte hinweg die Freiheiten des gesprochenen und geschriebenen Dialektes ebenso genutzt, wie sie die für Datenbanken eigentlich notwendige Eindeutigkeit der Schilderung von örtlich klaren Sachverhalten außer Acht gelassen haben. Es handelt sich aus Sicht der Informatik um "unscharfe Daten".
Illustriert wird diese Problematik exemplarisch anhand der Graphik zu einigen ausgewählten Daten eines Andreas Gräz, der im 18. Jahrhundert am Unterlauf des Inns lebte(siehe Bild)). Er wurde 1708 in der Pfarrei Neukirchen am Inn geboren und heiratete auf den Mautnerhof in der Nachbarpfarrei Dommelstadl, durch Eheschließung mit der Witwe des Vorbesitzers. Nach deren Tod nur drei Jahre später heiratete der nunmehrige Witwer und Hofbesitzer erneut. Aus der zweiten Ehe gingen fünf Kinder hervor, wovon zwei frühzeitig verstarben und eines noch zu Lebzeiten des Vaters heiratete. Andreas Gräz war vielfach Pate und Zeuge für Familien vornehmlich der Nachbarschaft und für die weitschichtigere Verwandtschaft. Im Jahr 1790 verstarb er 81jährig.
Allein der Ortsname Dommelstadl kommt in den dargestellten Einträgen in sechs Dialekt- beziehungsweise Schreibvarianten vor: Dommelstadl, Domelstadl, Dumelstadl, Dumlstadl, Tumelstadl, Dumenstadl. Wie schwierig die eindeutige Zuordnung von Angaben zu Datenfeldern einer Datenbank ist, zeigt die Verwendung des Hofnamens, eine meist vom Familiennamen eines historisch bemerkenswerten Vorbesitzers abgeleitete Bezeichnung eines bäuerlichen Anwesens. Im vorliegenden Fall war der Bauer auf diesem Hof an einer wichtigen Wegekreuzung in der Grafschaft Neuburg in früher Zeit wohl mit der Erhebung der Maut (Zoll) betraut gewesen. Diese wichtige Funktion prägte den Hofnamen "Mautnerhof", der noch heute existiert. Die Kirchenbuchführer verwendeten diese Bezeichnung als echten Hofnamen, genauso aber als Ortsangabe, als Beruf oder gar als Familiennamen. Die beiden frühzeitig gestorbenen Kinder des Andreas Gräz beispielsweise sind über eine Abfrage nach dem Familiennamen Gräz (inklusive dessen Schreibvarianten) nicht ermittelbar, da sie unter dem als Familiennamen verwendeten Hofnamen "Mautner" ins Beerdigungsbuch eingetragen worden sind.
Erst wenn die algorithmische Herausforderung des sicheren Umgangs mit unscharfen Daten und mit semantisch unterschiedlichen Bedeutungen eines Begriffs in den Einträgen bewältigt ist, kann eine automatische Zusammenführung solcher Personendaten erfolgreich ablaufen.
Eine möglichst lückenlose Personenrekonstruktion ist aber Voraussetzung für die automatisierte Familien- und damit Stammbaumrekonstruktion. Denn erst die in den Einträgen angegebenen Bezugspersonen wie Eltern, Ehepartner und Kinder erlauben die Verbindung einer Einzelperson zu ihren Ahnen, Lebenspartnern, Geschwistern und Nachkommen.<<
Schreiben Sie uns!
Beitrag schreiben