Vetenskapsrådet har beslutat att med drygt 5,6 miljoner kronor under tre år med start 2013, fortsätta stödja arbetet med att göra de svenska historiska folkräkningarna tillgängliga för forskningen. I fokus för projekt SweCens II är folkräkningen från 1930. Det årets material är helt unikt eftersom det, utöver uppgifter om kön, yrke, geografiska hemvist, civilstånd etc. som finns i alla folkräkningar, också har uppgifter om skolutbildning, barn i hushållet, inkomst och förmögenhet. Folkräkningen ger därtill fina möjligheter att länka personer från denna period till nutida befolkningsregister.
De svenska folkräkningarna är ett enastående material som finns från 1860 till Folk- och bostadsräkningarna tar vid 1960. De omfattar hela befolkningen för folkräkningsåren och innehåller ungefär samma uppgifter som finns i motsvarande källmaterial i andra länder i Europa och Nordamerika. För att möjliggöra internationell forskning i materialet kommer uppgifterna att kodas enligt en internationell standard, framtagen av Minnesota Population Center (MPC), University of Minnesota, USA. Därefter ska folkräkningarna länkas, så att man kan följa en och samma individ över flera folkräkningar.
Svensk demografisk forskning och svenska demografiska källor har en stark internationell position. Sverige är i den unika situationen att ha både högkvalitativa befolkningsregister i form av kyrkböcker och husförhörslängder och återkommande rikstäckande folkräkningar. Utifrån de förra har det i Sverige byggts upp flera världsunika longitudinella befolkningsbaserade databaser för vissa geografiska områden. Vad svensk demografisk forskning idag saknar är databaser som omfattar hela befolkningen, i synnerhet för den period som SweCens II kommer att arbeta med, tiden då det svenska välfärdssamhället formerades.
Folkräkningarna innehåller anmärkningsvärda ingångar för internationell och jämförande forskning av hög kvalitet och ger utomordentliga möjligheter att ytterligare stärka den redan starka svenska positionen på forskningsområdet. Det är högst troligt att digitaliseringen och kodningen av folkräkningen 1930 kommer att stimulera till fler samarbeten mellan svenska och internationella forskare. Dels för att de flesta andra länder enbart har folkräkningar, varför internationella forskare kan vara intresserade av att göra fler studier på svenskt material, dels för att svenska forskare kommer att ha tillgång till ett material som redan är skapat i en internationell forskningsinfrastruktur och harmoniserat med data från andra länder.
De historiska folkräkningarna finns till stora delar redan registrerade och tillgängliga för personhistorisk forskning. Folkräkningarna 1880, 1890 och 1900 finns att söka via Riksarkivets söktjänst (www.sok.riksarkivet.se) och folkräkningen 1910 är under arbete.
Projektet SweCens syftar till att tillgängliggöra folkräkningarna för forskning. Projektet är indelat i två faser. SweCens I fokuserade på kodning och länkning av folkräkningarna 1890 och 1900. SweCens II, som inleds år 2013, fokuserar på digitalisering, kodning och länkning av den ännu inte digitaliserade folkräkningen 1930. Här ingår även kodning och länkning av folkräkningarna 1880 och 1910.
Förutom själva kodningsarbetet har metoder för länkning av individer mellan folkräkningarna 1890 och 1900 utarbetats och utvärderats i projektets första fas. I sin fulla omfattning önskar SweCens göra samma insats med samtliga svenska folkräkningar (1860-1950), men då arbetet är omfångsrikt måste prioriteringar göras. Med stöd från North Atlantic Population Project (NAPP), som leds av MPC har kodningsarbete inletts för folkräkningen 1880. Folkräkningen 1910 kommer också att kunna kodas med stöd av MPC, vilket innebär att länkning av individer mellan folkräkningarna 1880, 1890, 1900 och 1910 kommer att kunna utföras inom projektet. SweCens fas II fokuserar dock framför allt på folkräkningen 1930.
Att koda och tillgängliggöra de svenska folkräkningarna för forskning blir ett viktigt komplement till de världsunika befolkningsdatabaserna vid Demografiska databasen (DDB) och Skånes demografiska databas (SDD). De longitudinella databaserna följer väl valda församlingar år efter år och kan därmed studera individers livsförlopp. Det folkräkningarna skänker är en möjlighet att göra tvärsnittstudier av hela den svenska populationen vid givna tidpunkter. Och genom att de är baserade på individdata kan de länkas till data i DDB eller SDD och personer kan följas mellan de olika folkräkningarna. Detta i sin tur gör det möjligt att testa många av de länkningsprogram och metoder som utvecklats internationellt och se hur de kan tillämpas på svenska folkräkningar.
Tre forskningsinriktningar
Digitalisering av folkräkningarna kan leda till minst tre olika slags forskningsinriktningar:
- Genom tvärsnittstudier av befolkningen är det möjligt att t.ex. göra geografiska och tidsmässiga jämförelser och kvalificera tidigare resultat som baserats på lokala befolkningar
- Med hjälp av ett register över totalbefolkningen kan man göra slumpvisa urval som kan länkas till annat material och besvara specifika frågeställningar
- Genom att länka tvärsnitt av totalbefolkningen vid olika tidpunkter kan man genomföra panelstudier som för de variabler som finns tillgängliga är jämförbara med moderna registerstudier.
Bakgrund och fakta
SweCens I: Svenska historiska folkräkningar - åtkomst för internationell forskning
År 2010 beviljade Vetenskapsrådet ett planeringsbidrag (Dnr 2010-5921) för kodning av folkräkningen 1890 och för utvärdering av metoder för länkning av folkräkningar. Med hjälp av detta planeringsbidrag har den svenska folkräkningen 1890 kodats i ett internationellt gångbart format. Även den sedan tidigare kodade folkräkningen 1900 har uppdaterats och harmoniserats med folkräkningen 1890. Det har också genomförts en rad tester och utvärdering av metoder för att länka folkräkningar. Arbetet med kodning av data har genomförts med hjälp av det standardformat som arbetats fram vid Minnesota Population Center (MPC), University of Minnesota, USA. De färdigkodade folkräkningarna 1890 och 1900 levererades i november 2011 till MPC. Pilotstudien har gett viktiga erfarenheter som legat till grund för planeringen av projektet SweCens II som beskrivs ovan.
Kodningsarbetet har lyckosamt genomförts med hjälp av de riktlinjer, filformat och kodlistor som ursprungligen tagits fram vid Minnesota Population Center (MPC), University of Minnesota, USA. Kodning av data innebär att informationen i folkräkningarna kodifieras i enlighet med MPC:s standardiserade kodlistor, vilka är lika för samtliga folkräkningar som tillgängliggörs via MPC:s webbplats:
www.pop.umn.edu.
Tidigare projekt
År 2008 publicerades, i samarbete mellan Riksarkivet, Stockholms stadsarkiv och Umeå universitet, den svenska folkräkningen 1900 via North Atlantic Population Project (NAPP). Den svenska delen behandlade alla personer som levde i Sverige den 31 december 1900, totalt 5,2 miljoner personer fördelade på 1,4 miljoner hushåll. För att kunna göra jämförande analyser mellan länderna har NAPP harmoniserat datastruktur, kodning och dokumentation för de olika ländernas folkräkningar. Totalt innehöll databasen då information om 93 miljoner personer och 19 miljoner hushåll. I SweCens-projektet har samarbetet utvidgats till att även omfatta Göteborgs universitet och Lunds universitet. MPC bistår med teknisk support och inte minst, att sprida folkräkningen till en internationell forskarvärld.
Läs mer
Inom ramen för SweCens-projektet kommer de digitaliserade svenska folkräkningarna 1880, 1890, 1900, 1910 och 1930 att kodas för vetenskapligt bruk. Folkräkningarna 1880, 1890, 1900 och 1910 kommer efterhand att bli tillgängliga för forskare via NAPP-projektets webbplats:
www.nappdata.org. Förhoppningsvis kommer folkräkningarna 1890 och 1900 att bli tillgängliga redan under 2012. Sedan 2008 finns en äldre kodad version av den svenska folkräkningen 1900 tillgänglig.
En utförlig beskrivning av de variabler som är tillgängliga i de kodade folkräkningarna 1890 och 1900 finns i detta PDF-dokument:
SweCens Variable Documentation 20120104.pdf