Projekttid 2010-04-01--2013-03-31
Projekttid för fördjupningsprojekt 2013-04-01--2014-03-31
Se informationsfilmen som beskriver Riksarkivets och Kungliga bibliotekets gemensamma tidningsprojekt, Digidaily.
Lite bakgrund:
I utvecklingsprojektet Digidaily har Riksarkivet, Kungliga biblioteket (KB) och Mittuniversitetet tillsammans utvecklat metoder för att digitalisera historiska dagstidningar i stor skala och skapat möjligheter för att söka i dem. Över tre miljoner tidningssidor har digitaliserats i projektet.
Finansiärer i projektet har varit: EU:s strukturfonder i Mellersta Norrland, Riksarkivet, Kungliga biblioteket, Mittuniversitetet, Schibsted Sverige AB och Länsstyrelsen i Västernorrland.
Den 1 april 2013 startades ett fördjupningsprojekt som kommer att pågå i ett år.
I fördjupningsprojekt Digidaily ska vi arbeta med modernt tidningsmaterial. Det moderna materialet skiljer sig produktionsmässigt från det äldre materialet; det är bland annat tunnare papper, mer färgtryck, kanske färgat tidningspapper. Vi ska också förfina och snabba på OCR-tolkningen och ytterligare effektivisera produktionsprocessen. En del ny utrustning i form av digitalkameror och skanners ska också testas för att se om vi kan få ett ännu mer fördelaktigt slutpris men med bibehållen eller bättre bildkvalité.
Digidaily - högsta värdsklass
Vi har nu haft slutseminariumet för projekt Digidaily och verkligen fått ett kvitto på att resultaten i projektet håller världsklass. Bland deltagarna fanns de två internationella digitaliseringsexperterna Simon Tanner och Edwin Klijn. Deras slutsatser om de projektresultat som uppnåtts framställdes i så starkt positiva ordalag som det bara går att uttrycka sig i. Av ojämförligt högsta världsklass, var ett uttryckligt omnämnande. Just kombinationen av toppkvalitet på bilderna, avancerad OCR-tolkning och ett ytterst konkurrenskraftigt bildpris, gör detta världsunikt.
Slutseminarium 6-7 februari 2013
När Digidaily nu närmar sig sitt slut genomför vi ett slutseminarium där vi blickar tillbaka på vad som uppnåtts inom projektet.
Frågor som kommer att lyftas är hur arbetet fungerat, vilka lärdomar vi dragit, vilka resultat som uppnåtts och vilka områden som bör ges ökad fokus framöver i debatten.
Slutseminariet kommer att genomföras under två separata dagar med representanter från Riksarkivet, KB, Länsstyrelsen i Västernorrland, Mittuniversitetet, Digisam och Digitaliseringskommissionen samt internationella experter inom digitalisering, OCR-tolkning och andra relaterade områden. Kollegor från de norska och finska tidningsdigitaliseringsprojekten kommer också att delta.
Lägesrapport 3
Period, mars 2011-mars 2012
Vi har nu kommit mer än halvvägs i projektet och har byggt upp en mycket god kunskap inom området tidningsdigitalisering. Idag har vi en relativt klar bild över hur storskalig tidningsdigitalisering ska bedrivas rationellt och effektiv. Likväl återstår fortfarande bland annat viss vidareutveckling av produktionsstödet, samt fortsatta tester av bildfångstutrustning.
Under perioden mars 2011 – mars 2012 har vi arbetat mycket med utvecklingen av produktionsstödet. Produktionsstödet är ett sammanhållande arbetsflödessystem som bland annat är metadatabärare och som stöder och styr produktion och processer för tidningsdigitalisering. Fram till dags dato är följande moduler driftsatta:
- Registrering. Registrering av leveranser sker hos KB vid tidningsdepån i Bålsta.
- Logistik och Arkiv. Följesedlar, arkivplats mm.
- Preparering. Gå igenom och ta isär buntar. Förberedelse inför bildfångst.
- Bildfångst. Skanning och indexering av bilder.
- Normalisering. Anpassning av filer till en bestämd mininivå.
- Teknisk filkontroll. Kontroll av filens tekniska parametrar.
- Okulär kvalitetskontroll. Säkerställande av tillfredsställande bildfångst.
Under perioden har arbetsmetoderna för logistik, arkiv, preparering, kvalitetskontroll och skanning förfinats. Vi börjar nu nå bra resultat inom dessa områden. En första utvärdering av arbetsmetoderna för bildfångst har påbörjats.
KB har hittills preparerat och levererat 1 625 000 sidor till MKC.
MKC har preparerat 1 551 445 sidor och skannat 513 433 sidor.
KB
I tidningsdepån i Bålsta plockas materialet fram och rengörs. Sedan gås tidningarna igenom på utgåvenivå.
Är tidningarna inbundna bläddras varje utgåva fram för att skapa en överblick över materialet när det gäller skick, bilagor, delar och editioner.
Hittas en alltför trasig utgåva kan ett kompletteringsexemplar sökas fram. Allt arbete och information om tidningen registreras i KB:s tidningsdatabas för att sedan exporteras till MKC:s produktionsstöd.
Christine Hägg preparerar SvD i Bålsta
MKC
På MKC prepareras sedan materialet inför skanning. Man bläddrar igenom bunten utgåva för utgåva, sida för sida, och gör bland annat följande bedömningar:
- Bedömer vilken kondition sidan befinner sig i, på KB kommer man att via produktionsstödet att få ut rapporter om reklamationsnivåerna och kan då göra efterforskningar om bättre förlaga finns.
- Stämmer av så att förregistrerade uppgifter så som typ, datum, antal sidor med mera stämmer.
- Kompletterar med till exempel uppgifter om bilagans och sektionens namn, bilagans ämnesområde, vilken genre delen tillhör – bilaga, löpsedel eller sektion, vilken edition utgåvan har, vilket nummer utgåvan har.
Efter det att bunten är genomgången görs det en bedömning om det är lämpligt att ta isär bunten till lösblad vilket medger en snabbare skanningsprocess.
Kjell Nilsson, Georg Lodin, Per Åberg och Karin Tiderman förbereder tidningarna inför skanningen
Digitalisering av dagstidningar har skett både på den befintliga utrustningen som finns på MKC men också på den nya bildfångstutrustning som köpts in för stora format, Zeutchel OS 14 000 och rullbäddsskannern MediaScan 860
Anders Broden skannar 4 sidigt på MediaScan
Pia Nordlander skannar tidningsuppslag på Zeutchel OS 14 000
Margareta Petterson kontrollerar bilder efter skanningen
Aktiviteter
- Projektgrupperna på KB och MKC har haft regelbundna projektmöten.
- En följeforskare från Oxford Research har anställts i projektet.
- Vi har deltagit på konferenser både i Sverige och utomlands både för att informera om vårt projekt men även för att ta del av andras erfarenheter.
- I november arrangerade KB ett halvdagsseminarium på temat, ”En tidningsdröm på väg att bli verklighet”. Seminariet vände sig främst till tidningar och tidningsforskare. På seminariet presenterades bland annat projekt Digidaily och KB:s avsikt med projektet.
- I november startade KB Bloggen,
http://digidaily.kb.se/, ambitionen med den är att alla som är nyfikna på digitalisering av tidningar får möjlighet att följa projektet på lite närmare håll.
- Riksarkivet blev medlem på Facebook under november och där har vi lagt ut nyheter då något intressant hänt i projektet. Där finns även möjligheter att ställa frågor och komma med synpunkter om projektet.
- Vi har lanserat en informationsfilm som beskriver projekt Digidaily. Filmen ligger på Riksarkivets webbplats,
www.riksarkivet.se, under Riksarkivet » Verksamheter » Projekt » Digidaily.
- Vi har blivit antagna till att föreläsa vid tre internationella konferenser om digitalisering.
o 12-15 juni, Archiving 2012 i Köpenhamn
o 11-17 augusti, IFLA 2012 i Helsingfors
o 26-28 september, MOW 2012 i Vancouver
- Vi har haft ett halvtidsseminarium på MKC med inbjudna digitaliseringsexperter från England och Holland.
- KB har arbetat om kravspecifikationerna gällande metadata, jpeg2000, namngivning med mera.
- Vi har arbetat med att gå från segmentering på sidnivå till segmentering på artikelnivå.
- Och sist men inte minst har KB enträget jobbat med fortsatt finansiering, för att kunna fortsätta tidningsdigitaliseringen efter projektets slut i mars 2013. Men mer om allt detta i kommande artiklar på KB:s Blogg,
http://digidaily.kb.se/.
Till höger här på sidan ligger en projektbeskrivning. Där kan du läsa mer om projektets mål och styrgruppens sammansättning, vilka som är med i projektet, finansiärer med mera. Där lägger vi även ut lägesrapporter. Här nedan kommer vi att lägga upp löpande information om projektet men även om utmaningar som vi ställs inför.
Kungliga biblioteket har ca 120 miljoner tidningssidor. I projektet kommer vi att digitalisera utvalda utgåvor av dessa tidningar, det mesta av tidningsmaterialet finns i Bålsta i Statens biblioteksdepå. Där hämtar vi material som KB har valt ut, främst Aftonbladet med start från 1830 och Svenska Dagbladet som startade 1884.
I projektet arbetar vi mycket med att utveckla ett produktionsstöd anpassat för tidningsdigitalisering och med metodutveckling, hur vi anpassar materialet för en effektivare digitalisering. Till exempel ska man skanna direkt från läggen eller ska man ta loss sidorna? Vilken skanner passar till vilket material? Hur lagar man trasiga sidor innan skanning? Vad ska man göra om sidorna är för trasiga? Frågorna är många.
Tidningarnas storlek och skick varierar under samma tidsperiod, den största tidningen som vi har haft här var hela 90*50 cm!
Linda Karström, Catharina Magnusson, Margareta Pettersson, Christine Hägg och Kjell Nilsson preparerar tidningar. De bläddrar igenom tidningarna, räknar och registrerar sidor och bedömer skicket på papperet. Pappersskicket varierar, vissa sidor är mörka andra ljusa, vissa är väldigt sköra, andra väldigt bra. De registrerar om sidorna är skadade eller om det saknas sidor. De gör också en bedömning om tidningen ska tas isär och digitaliseras som lösa blad eller om den ska digitaliseras som en bok. Vilken skanner som lämpar sig bäst för just den här tidningen. Arbetet är fullt av utmaningar, när de tror att de har kommit på hur just den här tidningen är uppbyggd så kommer de till ett nytt nummer som är helt olikt det tidigare.
Tack till alla från tidnings-och forskarvärden som kom till KB:s seminarium om Digidaily den 2 november 2011! Vi fick verkligen klart för oss att vi är på rätt väg och att det vi gör är efterfrågat och efterlängtat. Tack för all respons och bra relevanta frågor!
2011-11-04 På Riksarkivet:s Facebooksida kom det i onsdags en fråga om var det digitaliserade materialet i projektet finns att beskåda: svaret på den frågan är att i projektet produceras inte digitala bilder för allmänheten utan de produceras för att vi ska kunna utveckla rationella metoder och processer som möjliggör massdigitalisering och texttolkning av tidningar efter projektets slut, 2012-03-31.