Banbrytande öppen mjukvara och AI-modell för transkribering av handskrivna dokument
Vill du eller din organisation kunna transkribera stora mängder handskrivna dokument i er egen IT-miljö? Eller dokument som innehåller känsliga personuppgifter? Det vill vi på Riksarkivet också och nu kan ni använda vår modell Swedish Lion Libre!
Riksarkivets AI-labb har utvecklat en komplett HTR-lösning som inkluderar state-of-the-art modeller för svensk handskrift, samt ett banbrytande open-source projekt för att implementera HTR/OCR projekt i produktion – HTRflow!
Vår HTR-modell är tränad för att transkribera handskriven svensk löptest från cirka 1600-1900, och vår mjukvara, HTRflow, är framtagen för att kunna realisera alla HTR/OCR-projekt du kan tänka dig. Vi släpper dessa verktyg helt öppet, fria att använda, modifiera och bidra till, i hopp om att det på sikt ska ge en större tillgång till innehållet i handskrivna, maskinskrivna och tryckta handlingar från alla perioder och platser.
Swedish Lion Libre och HTRflow används redan inom Riksarkivet, men det går givetvis att använda HTRflow tillsammans med andra modeller än våra egna, till exempel OCR-modeller, modeller för att segmentera komplicerade layouter, eller HTR-modeller för andra språk.
Läs mer på HuggingFace:
https://lnkd.in/dQd2_EAH
https://lnkd.in/dEd5JnRh
Dokumentation för HTRflow finns på GitHub:
https://lnkd.in/ddPBm2qs
eller kontakta oss via mejl:
AI@riksarkivet.se