AI åbner døren til danskernes dødsårsager 1920-1943

4. maj 2026

AI åbner døren til danskernes dødsårsager 1920-1943

Et nyt, digitalt datasæt med næsten 1 million dødsattester er nu frit tilgængeligt for alle hos Rigsarkivet.

AI åbner døren til danskernes dødsårsager 1920-1943

Det Historiske Dødsårsagsregister

Nu bliver det nemmere for slægtsforskere, epidemiologer og andre forskere at finde frem til informationer om afdøde danskere. Dødsattester fra 1 mio. danskere fra perioden 1920 til 1943 er blevet søgbare via datasættet Det Historiske Dødsårsagsregister (HDAR).

Affotograferinger af dødsattesterne har ligget på Arkivalieronline længe, men nu har Rigsarkivet aflæst og digitaliseret attesterne ved hjælp af kunstig intelligens og struktureret data i tabeller. Dødsattesterne er dermed både blevet søgbare, og det er nu muligt at bruge oplysningerne om danskernes dødsårsager til statistiske beregninger.

Frit tilgængeligt data med interessant potentiale

Datasættet er frit tilgængeligt og indeholder fx disse variable:

  • Navn
  • Fødsels- og dødsdato
  • Erhverv
  • Dødsårsag
  • Følgesygdomme

Fra håndskrift til struktureret data

Dødsattesterne, som tidligere kun fandtes som håndskrevne dokumenter i arkiverne, er blevet digitaliseret og tolket ved hjælp af avanceret AI-teknologi.

Rigsarkivet har trænet AI til at kunne læse attesterne med transskriptioner af over 100.000 attester, som frivillige har transskriberet. Denne store frivillige indsats har gjort det muligt at omdanne ustruktureret tekst til et søgbart og analyserbart datasæt, der giver indblik i dødsårsager og sundhedsforhold i Danmark i første halvdel af det 20. århundrede.

Arbejdet er udført af Rigsarkivets afdeling for Data Science, som del af Multigenerationsregister-projektet, støttet af Novo Nordisk Fonden, der har til formål at kortlægge familierelationer i Danmark fra 1920 og frem.

Læs mere om Multigenerationsregisteret

En vigtig brik i sundheds- og samfundsforskning

HDAR dækker perioden før det eksisterende digitale dødsårsagsregister, som omfatter årene 1943–1969.

Med HDAR får forskere nu adgang til en sammenhængende dataserie, der muliggør ny forskning i arvelige sygdomme, dødelighed og andre områder, hvor familiære, sociale, geografiske og genetiske forhold spiller en central rolle.

Datasættet kan hjælpe os til at forstå, hvad der har haft betydning for forbedringen af folkesundheden i 1920’erne og 30’erne. Det er en interessant periode, hvor store socialreformer udbyggede sundhedsvæsenet med bl.a. kommunehospitaler og sygekasser, samt forbedrede sanitets- og boligforhold i byerne. Nu kan man studere effekten af reformerne helt ned på enkelte individer.

Slægtsforskning: Søg i samlingerne

For slægtsforskere og andre der vil søge efter en bestemt persons dødsårsag, betyder det at man nu kan søge direkte på navn, fødselsdato og dødsdato og finde dødsattester fra perioden 1920 til 1943. Det betyder at du måske kan finde ud af hvilke sygdomme dine aner havde, eller hvad familiemedlemmer i din slægt er døde af.

Søg i dødsattesterne via Søg i Samlingerne ved at vælge ”Dødsattester 4” som kildesamling.

Tilgængelighed og anvendelse

Da HDAR er baseret på offentligt tilgængelige oplysninger, er det frit tilgængeligt for alle, der ønsker at dykke ned i Danmarks medicinske historie eller udforske deres egen slægtshistorie.

Data i CSV og bonusmateriale

Datasættet er tilgængeligt for download i sin helhed i formatet CSV.  Når du downloader datasættet, henter du en zip-fil (112 MB), hvor der udover datasættet følger både metadata, nomenklatur for dødsårsager samt vejledninger på engelsk og beskrivelse af data og dokumentation.

Frivillige kvalificerer fortsat data

Datasættet vil efter planen løbende blive opkvalificeret af frivillige, der indtaster kilder og korrekturlæser via Rigsarkivets indtastningsportal. Således sikrer vi at eventuelle AI-aflæsningsfejl kan blive rettet. Hvis du har lyst til at være med til dette, så kontakt crowd@rigsarkivet.dk.