Arogance diletantů brání (nejen) vědecké práci
(Reakce na článek Pavla Machonina: Diletanti brání vědecké práci. Vymyšlený obchod se strategickými informacemi.)
"Everybody is ignorant, only on different subjects" (každý je ignorant, pouze v jiném oboru), praví heslo jednoho z předních světových lékařských časopisů. Nikdo není vševědoucí, skutečný badatel dnes a denně stojí s pokorou před matkou přírodou jejíž tajemství se snaží poodhalovat. Pouze diletanti (kteří si ovšem svůj diletantismus neuvědomují) znají rychlá řešení a mají sklon vynášet kvapné závěry.
Je totiž nutno mít stále na paměti, že každý jsme diletantem v jiném, než v tom svém zákoutí. A tak stejně jako je informatik diletantem v sociologii, tak i sociolog je diletantem v informatice. A jestliže se informatik pozastavuje nad tím, jak je možné, že cizí osoba drží v ruce bianko orazítkovaný a podepsaný průkaz tazatele ČSAV a ČSÚ spolu s dokumenty, které veřejné rozhodně nejsou (protože ví, jak zatraceně snadno se v dnešním globalizovaném světě se dají nehlídané informace zpeněžit), nemusí si hned od sociologa vysloužit arogantní útok.
Konec konců i mně připadají úvahy Štěpána Kotrby ohledně kšeftování s individuálními daty z mikrocenzu 92 přehnané, ba dokonce stejně směšné, jako někdejší tvrzení Necenzurovaných novin a Českého deníku, že účelem mobilitního šetření bylo obstarat informace pro komunistickou stranu. Nicméně ale arogance, s níž se Petr Matějů v článku "Fascinovaný diletant v roli vyšetřovatele" do Štěpána Kotrby obul, mě poněkud zarazila. Nemusím s někým souhlasit, dokonce mi jeho závěry mohou připadat úplně zcestné, ale je vždycky výhodné se snažit věcně pochopit uvažování oponenta, než emotivním útokem prosazovat své ego.
Sociolog si nemusí do konce uvědomovat riziko podcenění ochrany zpracovávaných dat, které jsou čím dál tím více lukrativnějším zbožím a tak mu někdy mohou urputné snahy informatiků o datovou bezpečnost připadat jako diletantské bránění výzkumu. Právě z tohoto nepochopení zřejmě pramení i výroky profesora Machonina v článku "Vymyšlený obchod se strategickými informacemi" o tom, že veřejná kritika sčítání lidu odborníky informačních technologií vážně potenciálně poškodila "důležitý a nepostradatelný zdroj informací o společnosti, bez něhož nemůže kvalitně fungovat ani vědecké poznání, ani kvalifikované politické řízení společnosti."
"To, co je pochopitelné a snad i omluvitelné u prostého občana, je hrubým opomenutím u odborníků disponujících potřebnými informacemi a znalostmi," výhružně píše prof. Machonin a na závěr se ptá: "Kdo před kým se bude za tuto nenapravitelnou škodu zodpovídat?"
Myslím si, že tím, kdo bude platit za řadu pochybení v komunikaci s občany tohoto státu nebudou informatici. Ti neskrývali své názory za sukně tiskových mluvčí, netvrdili blábolivé nesmysly o bezpečnosti CD-ROMů v trezorech ČNB!
Problém je už od počátku v komunikaci - kritika způsobu praktického provádění sčítání se v informatické veřejnosti objevila záhy poté, co ČSÚ zveřejnil prováděcí předpisy. Protože ty teprve ozřejmily, jak hluboká je neznalost statistiků v bezpečnostní problematice.
Přiznávám, že připomínkové řízení k zákonu i k prováděcím předpisům bylo mimo oblast zájmu řady dnešních kritiků - koneckonců, problematika cenzu se týká spíše sociologů, než informatiků. Ve věku informačních technologií se však informatiků dotkla. Protože teprve dnes si profesionální systém na porovnávání obrovských datových souborů může pořídit každá větší firma či reklamní agentura.
Shodou okolností jsem předsedou "Odborné komise ČSSD pro informatiku a telekomunikace", tedy odborné komise politické strany, která má nyní exekutivní zodpovědnost a proto sledování všech politicko-informatických souvislostí je v "popisu práce" naší komise.
Na hrozící problémy se sčítáním mě upozornil jeden z expertů naší komise krátce po zveřejnění příslušných prováděcích předpisů. Bylo zřejmé, že způsob zajištění ochrany osobních dat při blížícím se sčítání lidu, domů a bytů (zejména uvádění rodného čísla jako jednoznačného identifikátoru osoby na dotaznících pro statistické šetření) je zcela nedostatečný a je i v rozporu se současnou legislativou ochrany osobních dat.
Obávali jsme se (a nyní se stále zdá, že oprávněně) možné reakce části občanů, kteří pod vlivem pochybností odborníků i novinářů, vyslovovaných veřejně do médií, se rozhodnou do dotazníků uvádět některé údaje záměrně nepravdivě nebo neúplně.
Domnívali jsme se, že více než důrazná slova a výhrůžky desetitisícovými pokutami zde pomůže pouze taková ZMĚNA prováděcích pravidel plánovaného sčítání, která důvěryhodně zvýší stupeň zabezpečení citlivých osobních údajů.
Lidé, kteří budou mít jistotu, že zákonem striktně vyžadovaná data nemohou být nijak zneužita, nebudou do dotazníků uvádět nepravdivé nebo neúplné informace. Výsledkem by bylo získání přesnějších dat při sčítání.
Naše komise proto vypracovala návrh oddělení identifikačních a věcných částí příslušných dotazníků, který podstatným způsobem zvyšuje bezpečnost ochrany osobních dat.
S tímto návrhem jsem se ještě obrátil na Národohospodářskou komisi ČSSD, kde náš návrh získal plnou podporu.
Základním principem našeho návrhu je důsledné oddělení údajů identifikujících fyzickou osobu a její adresu od ostatních věcných dat, které občan státu poskytuje při statistickém šetření (ty mohou být následně identifikovány pouze podle sčítacího okrsku).
Každý sčítací dotazník by měl dvě fyzicky oddělené části: první s identifikačními daty občana, bytu či domu a druhou s šetřenými věcnými údaji. Ke každému dotazníku by se přidělilo náhodně zvolené neopakující se číslo - tzv. jednoznačný identifikátor. Toto číslo, např. ve formě dvou samolepek, kde by bylo vyjádřeno v čárovém kódu, by se přilepilo na každou část dotazníku.
Důležité je, že obě části dotazníků by byly následně zpracovávány ve dvou různých pracovištích. Jak v papírové, tak i v digitální formě v počítači by se tedy nikde ani na okamžik neobjevila zároveň data jež občana identifikují společně s daty, které občan státu poskytne pro statistické zpracování. Proto ani teoreticky by tedy nehrozilo zneužití poskytnutých dat.
Jedno pracoviště by pod přísným dohledem Úřadu na ochranu osobních údajů zpracovávalo první části dotazníků s osobními identifikačními údaji. Chráněným tajným údajem by totiž byla vazba náhodně přiděleného číselného identifikátoru na data, podle kterých by bylo možno zjistit totožnost respondenta (přes rodné číslo, jméno, příjmení, adresu). Tato data by byla tajná, nesměla by opustit pracoviště a po zpracování by se zničila. Zpracování by spočívalo v roztřídění náhodně přidělených číselných identifikátorů, reprezentujících jednotlivé fyzické osoby, byty a domy na příslušných dotaznících, podle sčítacích okrsků.
Takto setříděné identifikátory pak mohou sloužit jako klíče pro vlastní statistické zpracování, prováděné druhým pracovištěm.
Důležité je, že ze samotného číselného identifikátoru by nešlo zpětně zjistit osobu, identifikovat adresu bytu či domu.
Z dat shromážděných při sčítání by tedy v žádné fázi zpracování nebylo možné údajům o majetku či vybavení bytu zpětně přiřadit konkrétní fyzickou osobu či konkrétní adresu bytu. Šlo by pouze zjistit příslušný sčítací okrsek.
Uvedená metoda odděleného zpracování věcných a identifikačních údajů pomocí rozdělených formulářů není nová. S její modifikací se mnozí setkali např. při zpracování testů na přijímacích zkouškách na vysoké školy. Lze jen s politováním konstatovat, že bezpečnou metodu sběru a zpracování dat Český statistický úřad nezohlednil v prováděcí vyhlášce k zákonu a přes četné námitky odborníků tvrdošíjně trvá na zvolené metodě zpracování, která v občanech nebudí důvěru a pravděpodobně povede ke zkresleným výsledkům.
V praxi by se dokonce daly využít i současné dotazníky, v nich by se vyplňovaly všechny položky neobsahující identifikační údaje (osoby, bytu, domu). Ty by se vyplnily na zvláštním formuláři, který by bylo nutno urychleně dotisknout. Bylo nám jasné, že změna pravidel by znamenala jisté úsilí i další náklady, avšak domnívali jsme se, že ty miliardy korun, na které sčítání přijde, by přece stály za trochu úsilí o kvalitnější výsledek.
Na zasedání předsednictva naší komise jsme návrh předali ministru Karlu Březinovi. Bohužel se mu ho nepodařilo ve vládě prosadit, protože 7. února vláda vydává prohlášení kde se rázně ohrazuje proti zpochybňování průběhu sčítání a způsobu ochrany údajů. "Takové jednání vláda považuje za naprosto nezodpovědné," doslova hřímal mluvčí vlády na adresu zpochybňovačů na tiskové konferenci. (Jediný kdo hlasoval proti tomuto usnesení byl Karel Březina).
Mezi reptaly, brojícími proti plánovanému způsobu sčítání patřil i Úřad na ochranu osobních údajů (ÚOOÚ), který brojil proti uvádění rodných čísel v dotaznících a podle kuloárních informací při jednání mezi ČSU a ÚOOÚ již prý bylo téměř dosaženo dohody o tom, že rodná čísla ze sčítacích archů zmizí. S rozhodnou podporou vlády v zádech nakonec ovšem ČSÚ rodná čísla z formulářů odmítl odstranit, protože je údajně potřebuje k odstranění duplicit. Náš návrh odděleného zpracování identifikačních a věcných dat by tento problém elegantně řešil.
Nemám ve zvyku naše spory, naše názory, naše doporučení vládě zbytečně medializovat - to nechávám politikům. A právě proto jsem dlouho o horkém bramboru spojeném se sčítáním nikam nepsal.
Teprve když jsme vyčerpali všechny (před veřejnou publicitou skryté) kroky, které by mohly přimět vládu, aby sama přišla s vlastním návrhem řešení, rozhodli jsme se jeho podstatu zveřejnit - 10. 2. jsem proto v Právu publikoval článek "Sčítání může být bezpečnější" a následně v 7. čísle časopisu Ekonom článek "Přepulte velkého bratra".
Bohužel, ze strany odpovědných politiků nebyla žádná reakce.
Zdánlivě je přece všechno v pořádku, občané nějaké údaje do příslušných kolonek sčítacích dotazníků přece jen píší. Průzkum veřejného mínění ale naznačuje, že statisticky zdaleka nezanedbatelné množství lidí se však chystá uvést do dotazníků údaje neúplné nebo nepravdivé Obávám se, že sebedůraznější vládní prohlášení či hrozba pokut je k větší pravdomluvnosti nepřinutí. Tím spíš, že za odmítnutí vyplnit kolonku může být člověk popotahován, ale za nesprávnost nikoli.
Pak ale výsledkem velmi drahého podniku tedy budou nepřesné údaje získané za bratru 2,4 miliardy!
"Položme na jednu misku vah výdaje za zešvejkované sčítání lidu a na druhou nezadatelné právo úřední moci nepřiznat chybu. Co váží víc je jasné. Zvláště když chybí třetí miska, na níž by bylo možno zjistit váhu promrhané občanské loajality," píše v sobotním Právu Jiří Franěk.
A ta promarněná důvěra občanů, podle mého názoru, je ale tou největší ztrátou.
PS: Byl bych rád, aby Štěpán Kotrba i Pavel Machonin nebrali tento článek jako útok.
Velmi dobře vím, že i já jsem diletant, pokud mluvím o sociologii, diletant je ale i sociolog, pokud mluví o informatice a hází za hlavu důležitost ochrany osobních dat.
Poznámka Štěpána Kotrby: Naprosto neberu názor kolegy Kofránka jako útok. Není proč. Jiří Kofránek se mýlí. Neumí anebo nechce umět číst. "Údaje obou dotazníků přitom bylo možné propojit kdykoliv po jejich převzetí, neboť spojovacím článkem byly ony 'paginy'. K porušení oficiálních pravidel přísně technicky vzato mohlo dojít kdykoliv od chvíle, kdy se veškeré dotazníky zpracovaly do strojového tvaru." , "datový archiv šetření SSVE" - to byly ty myšlenky a formulace z mého