Frivillige skal lære maskine at aflæse medicinalberetninger

29. marts 2023

Frivillige skal lære maskine at aflæse medicinalberetninger

Rigsarkivet har de seneste måneder arbejdet på lanceringen af en ny type indtastningsprojekt, der kombinerer frivillige indtastere med maskiner, der skal lære at læse håndskrift i medicinalberetninger fra 1890’erne.

alt

Projektet blev skudt i gang i sidste uge med en præsentation af projektet på Rigsarkivet i Viborg. Deltagerne i arrangementet er nu i gang med at teste arbejdet med indtastning af medicinalberetningerne.

Nyt knopskud på Rigsarkivets frivilligaktiviteter

Projektet er et pilotprojekt, der skal give Rigsarkivet ny viden og erfaringer med HTR-teknologien (handwritten text recognition) og frivilligsamarbejdet gennem tekstgenkendelsesprogrammet Transkribus.

”På Rigsarkivet har vi efterhånden 30 års erfaring med frivillig indtastning af arkivalier. Langt størstedelen af vores projekter har haft fokus på indsamling af strukturerede data. De har traditionelt været rettet imod slægtshistorisk interesserede, som udgør en stor gruppe af dygtige og ihærdige frivillige,” fortæller arkivar Markus Schunck.

”I dag kan computere mere og mere i forhold til tekstgenkendelse, også af historiske tekster. I det her projekt undersøger vi, hvordan vi kan udnytte HTR-teknologien til at understøtte vores frivilligprojekter. Vi skylder vores bidragsydere at bruge deres kræfter dér, hvor effekten er størst. Frivillige kommer med en specialviden om for eksempel historiske håndskrifter, en egn eller et materiale, som vi ikke kan undvære,” supplerer arkivar Lisette Rønsig Larsen.

Medicinalberetningerne er en lærerig udfordring

Medicinalberetningsprojektet er nyt i både emne, indhold og rammer for indtastningen. Indtastningen giver indblik i lokal- og medicinhistorie for forskellige områder i Danmark, indholdet er skrevet i fuldtekst, nærmere betegnet en blanding af lange maleriske beskrivelser af lokale sundhedsforhold og statistiske optegnelser over fødte, døde og stort set alt derimellem, og rammen er brug af tekstgenkendelsesprogrammet Transkribus.

”Igennem de sidste par måneder har vi haft et par ”test-indtastere” til at give feedback på både indtastning i webudgaven af Transkribus og indtastning af medicinalberetninger. De har været begejstrede for både programmet og projektet. Nu har vi så rekrutteret nye indtastere, som kan være med til at skabe den træningsdata, som er forudsætningen for, at vi kan arbejde med HTR-teknologi,” fortæller arkivar Lisette Rønsig Larsen.

Kommer forskere og slægtsforskere til gode

Medicinalberetningerne indeholder oplysninger om helbredet, sygdomme, liv og død i fortidens Danmark, både store verdensomspændende pandeminer og generelle sundhedsforhold i de små lokalområder. Derfor vil forskere kunne bruge det færdige materiale til at forstå pandemier og sundhedsforhold for perioden – både de nationale forhold og de lokale.

Samtidig kan slægtsforskere og andre interesserede dykke ned i deres slægts skæbner ved at kigge på leveforholdene for de lokale områder.

Projektet blev skudt i gang i sidste uge med en præsentation af projektet på Rigsarkivet i Viborg. Deltagerne i arrangementet er nu i gang med at teste arbejdet med indtastning af medicinalberetningerne.

Vil du vide mere om projektet, er du velkommen til at kontakte teamet på crowd@sa.dk.