Multigenerationsregisteret

Multigenerationsregisteret

Med støtte fra Novo Nordisk Fonden udvikler Rigsarkivet et nyt multigenerationsregister over danskernes familierelationer siden 1920.

alt

Muligt at forske på tværs af mange generationer

Dansk forskning er internationalt førende og anerkendt for at kunne analysere meget lange tidsserier med historiske data fra registre, biobanker og historiske arkiver. Oplysningerne kan sammenstilles via CPR-nummeret – dog med den klare begrænsning, at undersøgelser af sundhed og social mobilitet i dag kun kan belyses gennem et par generationer, da slægtskab i CPR-registret kun er registreret for børn født fra 1960 og frem.

Data fra tiden før CPR-registeret

Med skabelse af et nyt epokegørende multigenerationsregister vil Rigsarkivet nu gå skridtet videre og skabe mulighed for at forske på tværs af generationer i et meget længere perspektiv, så data kan bindes sammen fra tiden før CPR-registret. Multigenerationsregistret vil kunne identificere slægtskab mellem alle danskere født helt tilbage fra 1920. Dermed bliver der mulighed for at forske i arvelige og familiære forholds betydning for bl.a. sundhed og sygdom.

Etablering af familierelationer

Multigenerationsregisteret vil binde oplysninger om familierelationer for personer fra CPR-registret sammen med de mange ældre oplysninger fra kirkebøger, så der kan etableres familierelationer mellem alle danskere siden 1920. Det sker i samarbejde med forskere fra Center for Registerforskning ved Aarhus Universitet, der bliver ansvarlige for at linke de rigtige individer sammen på tværs af CPR og de historiske kirkebøger.

Sundhed og sygdom over 3-5 generationer

Mange sociale og sundhedsmæssige problemer formodes at kunne forklares ud fra familiære forhold, så der er vigtig viden at hente, hvis forskerne får mulighed for at studere fænomener over 3-5 generationer. Det vil kunne give langt større indsigt i, hvordan arvelige og familiære forhold påvirker bl.a. sundhed og den sociale livsbane, og denne viden vil forskningen kunne bruge til at udvikle bedre behandlinger, herunder udvikling af personlig medicin, samt forebyggelse af sociale og helbredsmæssige vilkår.

Analoge kilder digitaliseres med AI

I arbejdet med at linke CPR-registret til oplysninger fra Rigsarkivets kirkebøger, udvikler forskere fra Københavns Universitets Center for AI udvikle algoritmer, der kan tyde de håndskrevne kirkebøger. Det er et vanskeligt arbejde, for der er mange forskellige håndskrifter i kirkebøger fra godt 2000 sogne over en periode på knap 60 år. Algoritmerne trænes dels på manuelt indtastede kirkebøger og dels på et datasæt, der kombinerer oplysninger om navne og datoer fra kirkebøgerne med den digitale gengivelse i CPR-registret.

Træningsdata

MGR har i samarbejde med Center for AI ved Københavns Universitet udarbejdet et datasæt bestående af billeder af fødselsdatoer og løbenumre fra kirkebøger. Til hvert billede af en dato eller løbenummer hører en label bestående af billedets sande indhold, altså den transskriberede dato eller løbenummer.

Datasættet kan benyttes til at træne machine learning modeller til genkendelse af håndskrevne datoer og håndskrevne tal generelt. Anvendelsen af datasættet er dokumenteret i artiklen Date Recognition in Historical Parish Records. Datasættet er open source og er tilgængeligt på GitHub.

Samarbejdspartnere og fondsstøtte

Multigenerationsregistret bliver muliggjort af en bevilling på 38 mio. kr. fra Novo Nordisk Fonden. Det er Rigsarkivet, der leder projektet i samarbejde med forskere fra Aarhus, Københavns Universiteter og Det Koordinerende Organ for Registerforskning (KOR).

Du kan læse mere om multigenerationsregistret på Det Koordinerende Organ for Registerforsknings hjemmeside.

Du kan også læse om projektets opstart i pressemeddelelsen om Multigenerationsregisteret, november 2020.