Banbrytande öppen mjukvara och AI-modell för transkribering av handskrivna dokument 

2024-10-02

Vill du eller din organisation kunna transkribera stora mängder handskrivna dokument i er egen IT-miljö? Eller dokument som innehåller känsliga personuppgifter? Det vill vi på Riksarkivet också och nu kan ni använda vår modell Swedish Lion Libre!

For english

Riksarkivets AI-labb har utvecklat en komplett HTR-lösning som inkluderar state-of-the-art modeller för svensk handskrift, samt ett banbrytande open-source projekt för att implementera HTR/OCR projekt i produktion – HTRflow!

Vår HTR-modell är tränad för att transkribera handskriven svensk löptest från cirka 1600-1900, och vår mjukvara, HTRflow, är framtagen för att kunna realisera alla HTR/OCR-projekt du kan tänka dig. Vi släpper dessa verktyg helt öppet, fria att använda, modifiera och bidra till, i hopp om att det på sikt ska ge en större tillgång till innehållet i handskrivna, maskinskrivna och tryckta handlingar från alla perioder och platser.

Swedish Lion Libre och HTRflow används redan inom Riksarkivet, men det går givetvis att använda HTRflow tillsammans med andra modeller än våra egna, till exempel OCR-modeller, modeller för att segmentera komplicerade layouter, eller HTR-modeller för andra språk.

Läs mer på HuggingFace:

Dokumentation för HTRflow finns på GitHub:

eller kontakta oss via mejl:

Ett gammalt, handskrivet dokument med svårtolkbar text, där ett förstoringsglas framhäver en del av texten för att tydliggöra innehållet. Förstoringsglaset visar några ord i klartext, vilket illustrerar processen av transkribering och digital tolkning av historiska handskrifter.

New AI-models and software for transcribing handwritten documents: Say hi to Swedish Lion Libre and HTRflow!

Do you or your organization want to transcribe large volumes of handwritten documents in your own IT environment? Or documents that contain sensitive personal data? We at the Swedish National Archives certainly do! Now you can use our latest model, Swedish Lion Libre, together with our open-source software, HTRflow.

The AI-lab at the Swedish National Archives has developed a complete HTR-solution that includes state-of-the-art models for Swedish handwriting, as well as a groundbreaking open-source project for implementing HTR/OCR projects in production – HTRflow!

Our HTR model is trained to transcribe handwritten Swedish text from around 1600-1900, and our open source software is designed as a modular framework for implementing all HTR/OCR projects you can imagine. We are releasing these tools with complete open access, to be used, modified, or contributed to freely, in the hope that this will eventually lead to greater access to handwritten, typewritten, and printed documents from all periods and places.

Swedish Lion Libre and HTRflow are already being used within the Swedish National Archives, but it’s of course possible to use HTRflow together with other models than our own, such as OCR models, models that deals with complex layouts, or HTR models for other languages.

Go to HuggingFace:

HTR-flow on GitHub:

Send us an e-mail:

Kontakt
Hans Flodström

Visa alla nyheter