Vänligen vänta medan sidan laddas…
Vänligen vänta medan sidan laddas…
Vetenskapsrådet ger Riksarkivet 46,4 miljoner kronor för att utveckla Nationell arkivdatabas (NAD) till en nationell forskningsinfrastruktur. Satsningen gör fler handskrivna arkivhandlingar sökbara med AI och stärker tillgången till data för ny forskning inom flera områden.
– Riksarkivet har en central roll för forskningen och vi tar nu ett långsiktigt ansvar för att bygga upp den kompetens och teknik som krävs inom arkivområdet. Vår gemensamma satsning med Vetenskapsrådet gör det möjligt att utvinna ny kunskap ur arkiven och skapar förutsättningar för att träna språkmodeller baserade på autentisk information, säger riksarkivarien Daniel Forsman.
Sverige har omfattande arkivsamlingar från flera århundraden och i Riksarkivet finns miljontals digitala bilder av dessa dokument. I dag är det en stor utmaning att söka i och analysera materialet i större skala. Dokumenten i arkiven är av många olika slag och till största delen handskrivna. Det tidskrävande manuella arbetet begränsar möjligheten för forskare att studera omfattande materialmängder och följa utvecklingen över lång tid.
Riksarkivet och Vetenskapsrådet satsar tillsammans över 90 miljoner kronor i projektet under de kommande fem åren. Satsningen inkluderar teknisk utrustning, utveckling av applikationer, spetskompetens och användarstöd. Målet är att gå från att erbjuda enskilda dokumentbilder till att tillgängliggöra hela arkivbestånd som maskinläsbar data. Att arkivinformationen görs tillgänglig som strukturerad data gör handlingarna sökbara och användbara som källmaterial i forskning inom flera olika discipliner.
Arbetet knyter an till Riksarkivets utveckling av AI-modeller, bland annat basmodellen Swedish Lion för handskriven historisk text. Framöver kommer fler modeller att utvecklas för nya tillämpningsområden. Det kan handla om tabeller, kartor och andra dokumenttyper som inte bygger på löpande text vilket är det våra modeller är bäst på idag.
En central princip är att modellerna ska vara öppna och transparenta. Genom att träna modellerna på information direkt ur arkiven skapas förutsättningar för tillgängliga och sökbara handlingarna i stor skala. Detta säkerställer att forskningen vilar på en tillförlitlig grund där informationens ursprung och behandling är spårbar för forskarsamhället.
Satsningen innebär också en nationell samordning av digitaliseringsarbetet. Genom att etablera en sammanhållen struktur kan enskilda insatser bidra till en gemensam nationell resurs som kan användas tvärvetenskapligt.
– Anslaget ger oss resurser att skala upp användningen av modern teknik för att möta forskningens behov av sökbar information. Genom att utveckla öppna modeller tränade på information direkt ur arkiven förenklar vi tillgången till arkivinformation, något som främjar såväl kvalitativ som kvantitativ forskning, berättar Riksarkivets forskningsledare Olof Karsvall.
Inom ramen för satsningen kommer Riksarkivet utveckla en dataplattform för medskapande. Syftet är bland annat att ge forskare möjlighet att själva kunna bidra med data och därigenom medverka till att höja materialets kvalitet, exempelvis genom att korrigera och förbättra AI-genererade transkriptioner.
Även om infrastrukturen i första hand utvecklas för att möta vetenskapliga behov, innebär den en väsentlig förbättring av tillgängligheten för alla som använder NAD. Exempelvis så kommer handskrivet material som används mycket av släkt- och hembygdsforskare att bli mer lättillgängligt.
Satsningen på NAD stärker Riksarkivets roll i det nationella ekosystemet för forskningsinfrastrukturer. Riksarkivet deltar sedan tidigare i flera andra centrala infrastrukturer:
Fakta: Forskningsinfrastrukturer vid Riksarkivet
Enligt Vetenskapsrådets definition är en forskningsinfrastruktur avancerade verktyg som krävs för att bedriva forskning av högsta vetenskapliga kvalitet. Det innefattar resurser som databaser, arkiv och e-infrastrukturer som är öppet tillgängliga för forskare. En nationell infrastruktur ska ha en långsiktig plan för ledning, kompetensuppbyggnad och utveckling.
Fakta: Riksarkivet
Riksarkivet grundades 1618 och är den statliga arkivmyndigheten. Myndigheten har ca 400 medarbetare och har verksamhet på 11 platser. Här förvaras 70 hyllmil handlingar, varav cirka 7% har digitiserats i form av över 73 miljoner bilder.