Statistikaameti registripõhise rahvaloenduse projekti juht Diana Beltadze avab registripõhise rahvaloenduse olemuse, analüüsib meetodi kohta tehtud kriitikat ja rahustab, et saadavad andmed ei ole halvemad kui traditsioonilise küsitluse teel kogutud.
Diana Beltadze: Eesti on valmis registripõhiseks rahvaloenduseks
Iga rahvaloendus on eriline ja kordumatu, sest taustainfo muutub ajas. Eelmise loenduse meetodi valikul rõhutasime, et rahvaloenduse korraldamisega on vaja teha rahvastiku inventuur, sest teisi kogu rahvastikku hõlmavaid andmeallikaid peale inimeste küsitlemise ei olnud. Praegu on andmed registrites olemas.
Loenduse korraldamiseks kasutab statistikaamet 26 registrit ja tunnused, mis ei kajastu ühes registris terviklikult, saadakse mitme registri andmeid kokku pannes. Näiteks tervise kohta tehakse Eestis igal aastal mitmeid uuringuid, seega tervist loendustunnuste nimekirja lisades teeme tühja tööd ja mõttetut kulu, sest mõõdame näitajaid, mis on juba praegu igal aastal teada (näiteks oodatav eluiga või tervena elatud aastad). Eestis on registripõhise loenduse ettevalmistavas faasis tähelepanu pööratud ka väikeste rahvastikurühmade arvestamisele ning astutud samme, et registrites oleks info nende rahvusliku kuuluvuse, elukoha, emakeele või mõne muu loendusel küsitava tunnuse kohta.
Milleks rahvaloendus?
Väide, et andmete asendamine valimipõhiste uuringutega ei anna tegelikku ülevaadet väikeste rahvastikurühmade kohta, peab üldjoontes paika, kuid küsin laiema teemapüsitusena vastu, milleks ja kus on riigis eelmisel loendusel kogutud infot kasutatud.
Muukeelse rahvastiku kolmas põlvkond ei oska eesti keelt oluliselt paremini hoolimata sellest, et riigikeele oskuse infot koguti eelmisel loendusel ja loendustulemused olid kõigile otsustajatele kättesaadavad. On olnud mitmeid valitsusi, aga olukord pole muutunud. Ainsa põhjusena tuuakse ressursipuudus. Seetõttu küsin: miks on vaja piiratud ressursse veelgi kulutada, et saada teada seda, mida me iga-aastaste uuringute põhjal juba teame? Täpsematest andmetest on kasu siis, kui need ühiskonna heaks töötavad ja väärtust loovad.
Tänu eelmise loendusel kasutatud kombineeritud metoodikale oli võimalus e-loendusel ankeedi pooleli jätnud inimesed üle lugeda registrite põhjal ja andmeid küsitlusloenduse käigus veelgi korrastada.
Keele- ja terviseteadlased on avalikkusele väga aktiivselt esitlenud teemasid, mis kõik võiks loendusprogrammis olla. Kes kõvemini karjub, selle vajadused on olulisemad? Loendusandmeid vajavad ka kohalikud omavalitsused, lisaks on huvirühmad, kes leiavad, et just loendusel tuleks uurida liha söömist või mittesöömist, koguda andmeid inimeste sportimise kohta jne. Kui kõik küsimused loendusse lisada, siis oleks ankeedis umbes kakssada küsimust ja see pole mõistlik. Maailmas kehtib loendustunnuste suhtes minimaalsuse põhimõte, see tagab andmete kvaliteedi. Oluline on kontekstist lähtudes olukorda hinnata ja jõuda kokkuleppele, mis on ühiskonna jaoks kõige tähtsam.
Vastamata jätmine on probleem nii loenduse kui valimiuuringu puhul, eriti siis, kui küsitakse delikaatseid küsimusi näiteks tervise, usutunnistuse või kooselu kohta.
Andmed on poolikud
Mõlemal puhul aitab selgitustöö ja vastajate motiveerimine. Teist lahendust pole. Tänu eelmisel loendusel kasutatud kombineeritud metoodikale oli võimalus e-loendusel ankeedi pooleli jätnud inimesed üle lugeda registrite põhjal ja andmeid küsitlusloenduse käigus veelgi korrastada. See oli strateegiline samm. Selle võimaluseta ei oleks statistikaamet saanud kvaliteetseid leibkondade andmeid (kolmandiku andmed vajasid korrastamist). See kõik oli rahaliselt kulukas ja kergitas loenduse kogumaksumust.
Tegeliku ja registreeritud elukoha lahknevus on Eestis struktuurne viga, mis aja jooksul ise ei parane. Seda saab parandada, kui tõhustada noorte seas teavitustööd või kui kaotatakse kohalike omavalitsuste elukohapõhised hüvitised. Andmete ebakõla moonutab kolmandiku leibkondade andmete täpsust. Seda ei saa statistikutele ette heita! Statistikaamet saab loendusel koguda ütluspõhiseid andmeid, meie ei kontrolli, kas vastus on õige või vale. Valed vastused tulevad välja andmetöötluse käigus.
Nii selguski eelmisel loendusel, et umbes pooled e-loendusel osalenud märkisid hoolimata oma tegelikust elukohast elukohaks registris registreeritud aadressi. Esitasid tahtlikult või kogemata valeandmeid. Statistikaamet parandas andmed, määras tegeliku elukoha, kuid on oluline märkida, et loendusel niimoodi parandatud aadressi ei saa edaspidi rahvastiku arvepidamises kasutada, sest loendusel saadud elukoha muutumise kohta saab infot ainult taas küsitledes.
Praegu, kui statistikaamet on loenduse ettevalmistamisel registripõhise meetodi testimiseks korraldanud katseuuringu, kaks prooviloendust ning teinud mahuka leibkonna ja eluruumide kontrolluuringu, võib tõdeda, et loendusel registrite kasutamise suur eelis seisneb selles, et kõigi inimeste kohta on registrites andmed olemas ja mittevastamise andmekadu ei ole. Mitmesuguste meetmete tulemusena on lootust, et andmed täpsustuvad enne loendust veelgi.
Eesti 2021. aasta rahvaloendusel traditsiooniliste küsitlusmeetodite kasutamine inimeste tegeliku elukoha teadasaamiseks oleks veider, sest üldine liikumine toimub küsitluskoormuse vähendamise poole. See seaks kahtluse alla Eesti e-riigi maine.
Tõsi, 20-aastaste ja 40-aastaste vanuserühma puhul tuleb loenduse ettevalmistuseks jäänud aja jooksul veel pingutusi teha, et andmed oleksid väga hea kvaliteediga. Need vanuserühmad on murekohaks ka tavaloendusel, neid ei saa kätte või loendatakse neid valesti, näiteks üliõpilase loevad ema-isa enda juures elavaks, ehkki nooruk käib vanematekodus ainult nädalavahetusel või veel harvem.
Prooviloenduse edu
Kõikides loendust registrite baasil korraldatavates riikides on loendamise aluseks registrites registreeritud elukoht. Seda määratlust kasutavad ka tavalist loendust praktiseerivad riigid, nt Saksamaa, Šveits, Andorra jt. Niisugune lähenemine tagab andmete kooskõla, mis on vajalikud riigi juhtimiseks. Eesti haldusreform, valimised jne tuginevad registrite andmetele. Seades kahtluse alla registrite kvaliteedi, kahtleme oma riigi võimekuses ja jätkusuutlikkuses. Aeg on edasi läinud ja riik on arenenud. Tänavu toimunud teise prooviloenduse andmed näitavad, et registrite andmekvaliteet on oluliselt paranenud juba võrreldes kolm aastat tagasi toimunud esimese prooviloendusega! Registripidajad teevad tööd, registrite andmekvaliteeti parandatakse, jõustunud on seadusemuudatused täpsemate andmete saamiseks.
Eesti on loenduse ettevalmistamiseks teinud viimase kümne aastaga umbes 16 miljoni euro ulatuses kulutusi. Kulutusi planeeriti nii, et need ei oleks ainult loenduseks, vaid teeniksid kogu ühiskonna huve, st loenduse ettevalmistuse käigus korrastame ka registreid. Tavaloendus on kallis ja maailma riikide praktika näitab, et iga uus loendus on umbes kaks korda kallim kui eelmine. Seetõttu võeti Eestis juba 2009. aastal registripõhisele loendusele üleminekuga suund vähendada tulevikus loenduse kulu ja saada tihedamini kui iga kümne aasta tagant loenduse mahus rahvastikuandmeid.
Mudeldamine toetab
Veebiloenduse kasutamine on kindlasti edasiminek. Veebiloendus on väga tervitatav, kuid teadlaste pakutud 80-protsendiline vastamismäär ei ole reaalne. Eestis pole pärast eelmist loendust üheski veebiuuringus saavutatud 68-protsendilist vastamismäära. Ka ei lahenda veebiloendus tegeliku ja registreeritud elukoha probleemi ning nii saadud andmete täpsus jääb registripõhise loenduse omale alla. Registriandmete kasutamisel on teadmatusest jms tingitud ebatäpsused välistatud. Ekslik on väide, et maailma riigid panustavad veebiloenduste korraldamisele. Pigem panustatakse registrite loomisele (nt Inglismaa, Hispaania, Türgi), et vähendada kulusid ja vastajate koormust.
2021. aasta loendusel traditsiooniliste küsitlusmeetodite kasutamine inimeste tegeliku elukoha teadasaamiseks oleks veider, sest üldine liikumine toimub küsitluskoormuse vähendamise poole. See seaks kahtluse alla Eesti e-riigi maine. Mitte sellepärast, et registripõhist loendust ei korraldata, vaid oleks kummastav, miks e-riik ei rakenda ühiskonna jaoks matemaatikateadust.
Eluruumide ja leibkondadega seotud probleemide lahendamiseks on paljud registripõhist loendust korraldavad riigid (näiteks Island, Norra, Holland, Austria) kasutanud mitmesuguseid statistikameetodeid (modelleerimist, loendustööks erilist kaalumist), mille valik sõltub vastava riigi käsutuses oleva teabe hulgast ja iseloomust. Selge on see, et loendused ei kao, kuid tõusev trend maailmas on kasutada registrite andmeid, suurandmeid ja kombineerida neid valikuuringute andmetega.