Hvad sker der med historien, når arkiver bliver til data?

22. januar 2026

Hvad sker der med historien, når arkiver bliver til data?

Et nyt forskningsprojekt ved Rigsarkivet og Københavns Universitet undersøger, hvordan vores forståelse af fortiden forandres, når historiske arkiver omsættes til digitale data.

alt

Dokumenter til datasæt

I mange år er millioner af historiske dokumenter blevet transskriberet og samlet i store databaser ved hjælp af frivillige, forskere og, i de senere år, kunstig intelligens. Resultatet er omfattende historiske datasæt, som danner grundlag for ny forskning i befolkning, familie, arbejde og sociale forhold. Men denne data bliver ikke skabt af sig selv, og de metoder, der anvendes, er ikke neutrale. Derimod påvirker de, hvilken historie vi senere kan fortælle på baggrund af denne data.

Med forskningsprojektet Manglende, Forvanskede eller Normaliserede? Effekten af dataficering af arkivmateriale i stor skala (MiDiN-DatA) undersøger forskere fra Rigsarkivet og Københavns Universitet, hvordan forskellige måder at arbejde med historiske data på former fremtidens historiefortælling.

Projektleder og seniorforsker ved Rigsarkivet Bárbara Revuelta-Eugercios forklarer:

“Som historiker er det uomtvisteligt, at vores valg i dataopbygning og analyse påvirker de konklusioner, der kan drages. Men i takt med at store historiske datasæt i stigende grad opfattes som banebrydende og får en central rolle i nye digitale infrastrukturer, som dem vi selv arbejder med, mangler der fortsat systematisk forskning i de metodiske og historiefaglige overvejelser bag dem – og i deres konsekvenser for forskningen. Bevilling fra Augustinus Fonden giver os mulighed for systematisk at undersøge disse konsekvenser og for bedre at forstå, i hvilket omfang vi forvandler, forvrænger eller normaliserer fortiden, og hvordan vi kan mindske sådanne problemer.”

Projektet er finansieret af Augustinus Fonden med 4,7 mio. kr.

Mennesker, maskiner og deres samspil

Projektets to første dele undersøger, hvordan historiske data formes af de metoder, der bruges til at skabe dem. Her analyseres rent metoder hvor mennesker manuelt indtaster, stærkt automatiserede metoder baseret på AI teknologi, samt hybridmetoder, hvor menneskelig vurdering kombineres med algoritmer.

Formålet er at forstå, hvilke typer information der risikerer at gå tabt, blive forvansket eller normaliseret afhængigt af metodevalget, og hvordan fejl og skævheder kan ophobes eller i nogle tilfælde reduceres. Projektet undersøger samtidig, hvor menneskelig indsigt er afgørende, hvor automatisering er en fordel, og hvordan samspillet mellem de to kan anvendes mere bevidst.

Balancen mellem menneske og teknologi er et centralt fokus, forklarer Henriette Roued fra Københavns Universitet:

“Bevillingen giver mulighed for at genbesøge spørgsmålet om, hvad der i skabelsen og brugen af digitaliserede historiske data hører mennesket til, og hvilke opgaver der med fordel kan understøttes af teknologi”

I en tid med hastig udvikling i retning af løsninger der inkluderer kunstig intelligens er det afgørende at forstå både mulighederne og disse konsekvenserne af disse valg, understreger Henriette Roued:

“Hvis kulturarven og vores fælles historiefortælling skal drage nytte af teknologien, må vi forstå, hvor brugen af AI er ønskelig, og hvor den bør undgås, så vi ikke går på kompromis med vores grundlæggende samfundsværdier.” 

Mennesker som skabere og brugere af data

Projektets tredje del fokuserer på menneskers rolle i dataficeringen af arkiver. Både som skabere og brugere af store historiske datasæt, med særligt fokus på crowdsourcing-projekter gennem de seneste tre årtier.

Mennesker bidrager med erfaring, fortolkning og kontekstforståelse, for eksempel ved transskription af kilder eller udvikling af træningsdata til automatiserede metoder. Samtidig kan menneskelige bidrag også introducere fejlkilder og bias, som påvirker datas kvalitet og anvendelighed.

Projektet analyserer disse spørgsmål ved både at undersøge variation i menneskers arbejde med data og ved at analysere, hvordan forståelsen og brugen af historiske datasæt påvirkes, når data er skabt gennem store og komplekse dataficeringsprocesser.

Fra forskning til praksis

Projektet tager udgangspunkt i Rigsarkivets egne samlinger samt en række igangværende og afsluttede projekter og infrastrukturer, herunder Link-Lives, Mapping Freedom, Rigsarkivets crowdsourcing-portal samt de nyligt finansierede projekter Historisk Personregister (HisPeR) og ChildHomes.

Forankringen i konkrete kilder og forskningsspørgsmål gør det muligt at analysere, hvordan dataficeringsmetoder påvirker empirisk historisk forskning i praksis – blandt andet inden for børnedødelighed, migration og social mobilitet. Samtidig betyder koblingen til eksisterende infrastrukturer, at projektets resultater løbende kan afprøves og indarbejdes direkte i Rigsarkivets arbejde med historiske data i stor skala.

Fakta

  • Projektet ledes af seniorforsker Bárbara Revuelta-Eugercios ved Rigsarkivet sammen med et internt forskerteam (Tobias Kallehauge, Olivia Robinson og Asbjørn Thomsen) og gennemføres i samarbejde med forskere ved Københavns Universitet (lektor, Henriette Roued og professor, Anne Løkke).
  • Forskningsprojektet løber i perioden 2026-2029
  • Projektet er finansieret af Augustinus Fonden med 4,7M kr.
  • Resultaterne af forskningsprojektet blive formidlet gennem videnskabelige publikationer, arrangementer og undervisningsaktiviteter.

Forskere, der deltager i projektet

Rigsarkivet

  • Bárbara Revuelta-Eugercios, seniorforsker og projektleder, specialist i historisk demografi og ulighed i sundhed
  • Asbjørn Thomsen, seniorforsker, med fokus i social mobilitet og landbosamfund
  • Olivia Robinson, historisk datamanager med fokus på migration og kolonihistorie.
  • Tobias Kallehauge, data scientist med fokus på maskinlæring og automatiserede metoder
  • Markus Schunk, crowdsourcing koordinator, med fokus om brugerengagement og datakvalitet

Københavns Universitet

  • Henriette Roued, lektor i digital humaniora ved Institut for Kommunikation, specialist i digital kulturarv, GLAM-sektoren samt borgernes skabelse og brug af digital kulturarven.
  • Anne Løkke, professor ved SAXO-Instituttet med fokus på social-, kultur-, medicin- og sundhedshistorie, ca. 1750–1950.