En halv million ord flytter ind hos Rigsarkivet
En halv million ord flytter ind hos Rigsarkivet
475.000 ord fra Dansk Sprognævn er rykket ind hos Rigsarkivet, hvor en omfattende digitalisering og databehandling gør årtiers sproghistorie søgbar for alle.
1,1 million kartotekskort fra Dansk Sprognævn
Blækspruttepædagogik, ferielængslende og skærmdansk er blandt de mange nye “beboere”, der tidligere i år flyttede ind hos Rigsarkivet i Odense.
Ikke mindre end 30 arkivskabe med kartotekskort fra Dansk Sprognævn ankom nemlig til digitalisering. Skabene rummer Dansk Sprognævns omfattende ordsamling – en unik dokumentation af nye ord, udtryk og sproglig udvikling siden 1955.
Samlingen består af omkring 475.000 forskellige ord fordelt på cirka 1,1 millioner kartotekskort, som gennem årtier er blevet indsamlet af Sprognævnets medarbejdere. Mange af ordene findes ikke i traditionelle ordbøger, og materialet giver derfor et sjældent indblik i, hvordan sproget udvikler sig i praksis.
Fra administrativt arbejdsredskab til digital ressource
Materialet har indtil nu været i administrativ brug hos Dansk Sprognævn, men med digitaliseringsprojektet bliver det nu muligt at sikre indholdet digitalt og dermed også at give offentligheden adgang til samlingen.
Digitaliseringen af de mange ord er en del af Dansk Sprognævns projekt Ordsamlingen.dk. Dansk Sprognævn har modtaget støtte til projektet fra:
- A.P. Møller og Hustru Chastine Mc-Kinney Møllers Fond til almene Formaal
- Carlsbergfondet (CF25-1999)
- Skibsreder Carsten Brebøls Almennyttige Fond
Rigsarkivets medarbejdere begyndte på digitaliseringen i februar og projektet forventes afsluttet ved udgangen af 2026.
Kartotekskuffer fra Dansk Sprognævns ordsamling. Samlingen rummer ca. 1,1 millioner kort, som i øjeblikket digitaliseres af Rigsarkivet i Odense. Foto: Mons Studio.
Langsommelig, men vigtig skanningsproces
Selvom det indleverede materiale umiddelbart kan virke ensartet, viser arbejdet hurtigt, at virkeligheden er mere kompleks. Mange af kartotekskortene indeholder avisudklip eller andre teksteksempler, som fra starten er blevet sat på kortene for at dokumentere, hvordan ordet bruges i en konkret sammenhæng.
Det betyder at ikke alle kort kan skannes hurtigt, fordi større udklip eller flere lag papir kan kræve mere forsigtig håndtering. Variationerne i materialet betyder, at hvert kort skal håndteres individuelt. Nogle kan scannes hurtigt, mens andre kræver flere scanninger for at få alle oplysninger med. Processen kan derfor til tider være langsommelig – særligt når man ved, at der venter omkring 1,1 millioner kort.
Det er en stor opgave – og efter et par dage med kartotekskort begynder man at se dem for sig, når man lukker øjnene, men det er også dér, man mærker, hvor vigtigt arbejdet er.
Ny viden om sprogets udvikling i Danmark
Når skanningen er afsluttet, går projektet ind i sin næste fase. De digitale billedfiler overdrages til videre behandling hvor materialet skal omsættes fra rene billedkopier til strukturerede og søgbare data.
Ved hjælp af automatisk tekstgenkendelse udtrækkes centrale oplysninger fra kartotekskortene, herunder selve opslagsordet, ordklasse samt dato og år for den dokumenterede anvendelse. Disse oplysninger danner grundlag for en omfattende databehandling, hvor informationerne struktureres og kobles sammen i en database. Det er denne proces, der gør forskellen mellem en samling skannede billeder og en funktionel, søgbar løsning.
På sigt vil offentligheden kunne søge i ordsamlingen via Dansk Sprognævns kommende løsning, der kommer til at ligge på ordsamlingen.dk.
Projekt med perspektiver
Digitaliseringsindsatsen er imidlertid mere end blot en stor scanningsopgave. Projektet trækker på Rigsarkivets kapacitet til at håndtere omfattende og komplekse materialesamlinger, hvor arbejdet omfatter fysisk håndtering, teknisk digitalisering og efterfølgende databehandling.
Projektet bidrager med værdifuld erfaring i digitalisering af store kortbaserede samlinger – en type materiale, der ofte rummer særlige udfordringer. Erfaringerne kan få positiv betydning for fremtidige samarbejder og projekter, hvor fysisk arkivmateriale skal bringes ind i en digital kontekst.
På den måde rækker projektet ud over de 1,1 millioner kort: Det handler også om at udvikle metoder og kompetencer, der styrker arbejdet med at gøre vores kulturarv og dokumentation tilgængelig i en digital tidsalder.
Professionel assistance til arkivopgaver
Rigsarkivets enhed for Indtægtsgivende Aktiviteter tilbyder mod betaling at løse opgaver for både myndigheder, private personer og virksomheder. Det er fx opgaver som arkivordning, digitalisering og informationssøgning, som går ud over, hvad Rigsarkivet kan tilbyde som gratis service.