Bild: Hans Flodström
På Riksarkivet finns massor av arkiv. Arkiv som innehåller autentisk och specifik data som är intressant ur olika perspektiv. Tack vare AI gör Riksarkivet allt mer av myndighetens enorma arkivskatter tillgängliga så att både forskare och medborgare kan använda materialet i ännu större utsträckning.
Arkivpodden presenterar serien ”AI och arkiven” där du bland annat får veta mer om varför Riksarkivet är unikt när det gäller AI, hur vi jobbar med AI och hur det kan underlätta för forskningen. Medverkar gör Andrëa Grängsjö och Erik Lenas från Riksarkivet.
Avsnitt 2 – 4 juni 2024
AI och arkiven avsnitt 2. AI och historiska texter
Andrëa Grängsjö och Erik Lenas diskuterar hur Riksarkivet använder AI för att hantera historiska texter i det här avsnittet av Arkivpodden. Fokus ligger på Handwritten Text Recognition (HTR), en teknik för att tolka handskriven text och omvandla den till digital text. HTR gör det möjligt att söka i och förstå gammal text utan att kunna läsa handskriften själv.
Riksarkivet har arbetat med HTR sedan 2019 och har genomfört flera projekt, inklusive crowdsourcing för att transkribera 1800-talstext och använda den för att träna AI-modeller. Ett viktigt projekt är HTR-publicering, där digital text blir sökbar och kopplad till originalbilderna, vilket öppnar nya möjligheter för forskning och allmänhetens tillgång till arkivmaterial.
Erik nämner även att äldre handskrift inte nödvändigtvis är svårare att tolka än modern, så länge man har tillgång till träningsdata. Riksarkivet planerar att använda AI för att förbättra sökbarheten och interaktionen med historiska texter genom utveckling av historiska språkmodeller. Dessa modeller kan hjälpa till att översätta och förstå texter från olika tidsperioder.
Datadriven forskning är en annan central punkt i avsnittet, där AI och stora mängder digitaliserad text möjliggör nya typer av forskningsfrågor och globala jämförelser. Arbetet med att tillgängliggöra arkiv tar aldrig slut, då det alltid finns nya horisonter och teknologiska framsteg att utforska.
Avsnittet avslutas med en reflektion över vikten av att ha intressanta forskningsfrågor och hur samarbeten med forskarsamhället är avgörande för att driva utvecklingen framåt.
Lyssna på avsnittet (öppnas i soundcloud)
Transkribering av avsnitt 1: AI och arkiven (pdf)
Erik Lenas och Andrëa Grängsjö, Riksarkivet. Foto: Copyfabriken.
Avsnitt 1 – 30 maj 2024
AI och arkiven avsnitt 1. AI revolutionerar arkivhantering
I detta avsnitt av Arkivpodden från Riksarkivet diskuterar Erik Lenas och Andrëa Grängsjö användningen av artificiell intelligens inom arkivverksamhet. Erik förklarar att Riksarkivet fungerar som en data-hub med enorma mängder data som är avgörande för AI-tillämpningar. Myndigheten har omkring 270 miljoner skannade bilder, vilket utgör fem procent av Riksarkivets totala arkiv.
Det finns två huvudsakliga användningsområden för AI på Riksarkivet: effektivisering av interna processer och tillgängliggörande av material för forskning. Ett exempel som Erik berättar om är ett stort indexeringsprojekt, där AI används för att tolka och organisera fastighetsdokument. Vilket kraftigt förkortar söktiden och minskar slitage på originalhandlingarna.
I avsnittet får du också höra om framtida möjligheter med AI, som att utveckla chatbotar för att göra arkivinnehåll mer tillgängligt och sökbart på naturligt språk. Att prioritera vilka material som ska digitaliseras och indexeras är viktigt, en process som kräver samarbete med forskarsamhället.
Samtalet avslutas med reflektioner över AI:s nuvarande begränsningar och vikten av att tekniken redan nu kommer till nytta för både Riksarkivet och allmänheten. Avsnittet ger en inblick i hur AI kan revolutionera hanteringen och tillgängliggörandet av historiska arkiv.
Lyssna på avsnittet (öppnas i soundcloud)
Transkribering av avsnitt 1: AI och arkiven (pdf)
Erik Lenas och Andrëa Grängsjö, Riksarkivet. Foto: Copyfabriken.