Začíná sčítání lidu. Víte, k čemu sloužilo dřív, na co se statistici ptali a jak jsou data chráněná?

Data ze sčítání lidu se uloží na servery šifrovaně. Přístup k nim bude mít jen malý počet lidí vázaných mlčenlivostí

Sčítání lidu bude letos jednodušší a primárně online. Povinné údaje se oproti cenzu před deseti lety zúží téměř na polovinu, statistici totiž budou zjišťovat jenom takové informace, které nejsou dostupné z databází státu. 

Český statistický ústav (ČSÚ) předpokládá, že se elektronicky sečte výrazná většina obyvatel. Už při posledním cenzu tedy sčítání lidu v roce 2011 poslala elektronický formulář čtvrtina Čechů. Pro předvyplnění sčítacích formulářů i pro zpracování se už dalo využít údaje dostupné v registrech.

Čtěte také

Podobně tomu bude i letos, statistici využijí devět registrů včetně dat ministerstva školství ministerstva práce nebo České správy sociálního zabezpečení. I díky tomu bude potřeba zadat údajů o polovinu méně.

„Platí, že elektronický formulář pomáhá řadě nelogičností v odpovědích předejít už při vyplňování respondentem,“ vysvětluje mluvčí Sčítání 2021 Jolana Voldánová. „Součástí tohoto procesu je anonymizace dat, tedy odstranění identifikačních údajů osob, jako jsou jména, čísla dokladů nebo rodných čísel.“

Bezpečně a pod mlčenlivostí

Data budou statistici ukládat na servery Státní pokladny Centra sdílených služeb, které mají nejvíce zabezpečené kybernetické prostory v České republice.

„Vámi poskytnuté údaje jsou ukládány šifrovaně, a to ve vysoce zabezpečeném prostředí Státní pokladny Centra sdílených služeb na území České republiky. Státní pokladna Centra sdílených služeb disponuje vlastními bezpečnými datovými centry s nejmodernější architekturou. Data jsou následně v tomto zabezpečeném prostředí zpracovávána za účelem vytvoření statistických informací,“ ujišťuje Voldánová.

Čtěte také

Údaje, které lidé do elektronického formuláře zadají, by tak měly být chráněné od vstupu do systému přes zpracování a uložení dat, až po publikaci výsledků. Systém by měl zvládnout i nápor respondentů ve špičkách.

„V rámci sběru údajů prostřednictvím elektronických sčítacích formulářů při online sčítání je z důvodu zajištění potřebné propustnosti a rychlého obsloužení velkého počtu požadavků, zejména ve špičkách, propojení realizováno prostřednictvím globální služby Azure Front Door.“

Po zpracování Český statistický úřad data vymaže, aby se nedala v budoucnu zneužít. Zveřejňují se pak pouze sloučené, ne individuální statistické výsledky. Jinými slovy se data z formulářů budou využívat výhradně pro účely tvorby souhrnných statistik.

Jak doplňuje Jolana Voldánová, při sběru i zpracování dat je bude přítomný jen omezený počet pracovníků, kteří přijdou s údaji do styku: „Zúčastnění zaměstnanci jsou ze zákona vázaní mlčenlivostí, která trvá i po skončení sčítání. V souladu se zásadou minimalizace, kterou vyžaduje GDPR, uchováváme údaje pouze po nezbytnou dobu.“

Papíry ani letos nezmizí

K elektronickému formuláři na stránkách www.scitani.cz se půjde připojit buď pomocí elektronické identity, nebo datové schránky. Pokud k nim ale lidé přístup nemají, umožní jim statistici přihlášení po zadání platného dokladu a data narození.

Listinné formuláře ovšem nezanikají. Pokud se lidé nesečtou online, od 17. dubna budou tiskopisy k dispozici buď u komisařů v terénu, na vybraných pobočkách České pošty nebo přímo na pracovištích krajských správ Českého statistického úřadu. Vyplněné papírové formuláře se pak sváží na digitalizační pracoviště s velkokapacitními skenery.

„Po naskenování jednotlivých stran každého formuláře proběhne rozpoznávání znaků, které respondenti zapsali. Rozpoznávání je automatizované, ale pokud je odpověď obtížně čitelná, pokusí se písmena a čísla ‚rozluštit‘ pracovníci digitalizace,“ říká Voldánová.

S chybami pomůže elektronický formulář

Dalším krokem bude identifikace přesného významu odpovědí. To se děje převážně automatizovaně. Pokud odpověď obsahuje podstatnější chyby, posuzují pracovníci to, co měl respondent na mysli, zase individuálně. Následující fáze zpracování už jsou stejné jak pro data z listinných tak i elektronických formulářů. I když v případě těch listinných je zpracování vždy náročnější.

Čtěte také

„Často respondenti chybují například v adresách. I proto doporučujeme využít elektronický formulář, který respondentům pomůže zapsat odpověď správně, navíc díky našeptávačům a nabídkám výrazně rychleji,“ uzavírá Voldánová.

Údaje z formulářů se pak propojují s daty z registrů a databází státu. Odstraňují se duplicitní informace, řeší se nelogické odpovědi a celá řada dalších nesrovnalostí. Teprve po těchto úpravách je možné začít se samotným výpočtem výsledků. Vyhodnocení dat trvá nejméně několik měsíců. Výsledky proto statistici plánují zveřejnit na přelomu roku.

Zajímavostí je, že se v roce 2011 v obálkách s listinnými formuláři našly stovky dokumentů, které tam sčítané osoby vložily omylem. Byly to například občanské průkazy, rodné listy, školní vysvědčení, nájemní smlouvy nebo dokonce i dětské kresby.

autor: Martina Rasch
Spustit audio

Související