(Ne)Věřte průzkumům veřejného mínění
"Kdyby se dnes konaly volby, KSČM by v nich dostala 20,5 procenta hlasů voličů..."
První slova vydání Lidových novin z 18.9.1999
Co ovšem znamená těch 20,5% ?
Znamená to, že být dnes volby, získala by KSČM 20,5% odevzdaných hlasů? Nebo by získala hlasy 20,5%
"oprávněných voličů" (při dvoutřetinové účasti tedy nějakých 30% odevzdaných hlasů)? Nebo snad 20,5% lidí
je dnes pevně odhodláno volit KSČM?
Údaj 20,5%, pokud není přesněji vysvětlen, sám o sobě neznamená nic. Dokonce lze prohlásit,
že již první slova LN z 18.9.1999 nejsou na víc než 95 procent pravdivá.
Zveřejňování průzkumů veřejného mínění v českých novinách má značné nedostatky. Ty se
budu snažit ukázat právě na případu tzv. volebních preferencí a jako vzorky novin jsem si vybral
dvoje papírové - Lidové noviny a Mladou frontu Dnes, a dvoje internetové noviny a to Neviditelného psa
a Britské listy a to v období od 20.8.1999 do 18.9.1999.(Viz přehled).
Ovšem nutno ještě podotknout, že po těchto zprávách (zahrnutých v mém přehledu) často
následují ještě různé komentáře.
Všechny zprávy zahrnuté do mého přehledu mají minimálně jeden (a většina
oba dva)z následujích dvou nedostatků, které z nich ve svém důsledku dělají naprosto nevěrohodnou zprávu.
První nedostatek je nerozlišování volebních preferencí a volební prognózy (toto názvosloví zavedli v Sofres-Factum).
Volební preference je počet lidí, kteří při výzkumu prohlásili: "Budu volit stranu XY."
Ovšem v průzkumu lze najít i odpovědi typu "nevím" či "žádnou". Proto Sofres-Factum začalo
zveřejňovat také volební prognózy, kde výsledky "očišťuje" od takovýchto odpovědí.
Zde už je vidět rozdíl mezi papírovými a internetovými deníky. Zatímco v papírových je
rozdíl mezi preferencemi a prognózami uveden, v internetových jsou uvedeny pouze preference
(což je dle mě zavádějící - preference jsou nižší). Ovšem toto již neplatí, pokud jsou publikovány
údaje zbylých dvou českých "průzkumových" firem - STEM a IVVM. Zde jak v papírových, tak v internetových denících jsou
uvedeny pouze preference, aniž bylo jasně řečeno, co daný údaj vlastně znamená. Toto je
s největší pravděpodobností způsobeno bezmyšlenkovitým přebíráním zpráv od ČTK či přímo od
STEM či IVVM. (Můj názor ohledně tohoto v papírových novinách plyne za skutečnosti, že zatímco
zprávy založené na údajích od Sofres-Factum obsahují rozlišení preferencí a prognózy, tak
od zbylých 2 firem nikoliv - přitom ty noviny připravují stále ti stejní lidé).
Druhý zásadní nedostatek je absence jakýchkoliv údajů o přesnosti takového průzkumu. Zvláště
pokud je výsledek uveden ve stylu 21,1% (a nikoliv pouze 21%) je tím čtenáři sugerováno, že
daný údaj je velmi přesný. Ovšem to není pravda. I za předpokladu perfektně reprezentativního
vzorku populace, jsou odchylky i několika procent "normální".
Jaká je tedy přesnost těchto průzkumů?
Pokud je průzkum dělán dotázáním (+-)1000 lidí (Sofres-Factum), tak s 95% pravděpodobností
(běžná "přesnost" statistických měření)
můžeme říct, že jsme se nespletli o více jak +-3%, pokud nám vyšel výsledek někde kolem 10%
prefencí (např. Unie svobody) tato přesnost je samozřejmě lepší a nespleteme se o víc jak
+-2% (ovšem opět jen na 95%!!).
Pokud zvýšíme počet dotázaných na nějakých 1500 (STEM), zpřesníme tím největší chybu na +-2%
a u preferencí kolem 10% dokonce na méně jak +- 1,5% (samozřejmě opět pouze na 95%).
Z uvedého je zřejmé, že jakýkoliv článek založený na pohybu preferencí např. o 1% je naprosto
neseriózní. Stejně tak uvádění výsledků s přesností na jedno desetinné místo bez uvedení přesnosti
je neseriózní.
(Pro ilustraci snad co to znamená, "s pravděpodobností na 95%" - to přibližně znamená, že v 19 případech
z 20 máme pravdu a výsledek je skutečně to, co jsme změřili +- např. 3%; pokud tedy Sofres-Factum
zveřejňuje své výsledky dvakrát měsíčně, potom třeba pravděpodobnost, že alespoň jednou ročně skutečné preference
ODS jsou mimo naměřený údaj +-3% je víc jak 70%.)
Pokud se tedy vrátím k tvrzení za začátku článku, že LN již prvními slovy s největší pravděpodobností
nezveřejnily pravdu.
Zaprvé, 20,5% je procento lidí, kteří odpověděli "volil bych KSČM". Nejsou zde započteny hlasy
nerozhodnutých nebo naopak nejsou "odečteny" hlasy těch, kteří k volbám jistě nepůjdou. Ve volbách by
KSČM získalo mnohem spíše něco málo pod 30%. Ovšem i kdybych zanedbal tento problém, pokud vezmu i přesnost měření
+-2%, tak rozhodně šance, že výsledek bude skutečně přesně 20,5% (a ne třeba 20,4 či 20,6 nebo i 21,1...)
je rozhodně menší než mnou udaná hranice 5% (kdy bych LN skutečně křivdil). - Zde je třeba si uvědomit,
že u průzkůmů 1000 lidí znamená 1 člověk právě onu jednu desetinu procenta.
Jak jsem již na začátku psal, vybral jsem právě průzkumy předvolebních preferencí jako příklad, na kterém jsou dobře
vidět zásadní nedostatky, které se projevují i u jiných zpracování průzkumů - chybějící kvalitní údaje o přesnosti průzkumu
a dezinterpretace výsledků (číslo ve skutečnosti udává něco jiného než se novinář snaží vsugerovat).
Do kvality zveřejňování průzkumů např. Gallupovou organizací (The Gallup organization) mají české
noviny (a částečně i samotné firmy, provádějící průzkumy) ještě daleko... - a přitom zvednout kvalitu
zde jde poměrně snadno...
Bohužel tím ztrácí na důvěryhodnosti jak samotné průzkumy veřejného mínění (které, pokud víme,
co od nich můžeme čekat, opravdu ukazují na nějakou skutečnost), tak tím ztrácí velmi na důvěryhodnosti celé
noviny.
Zpracováno na základě těchto stránek www:
Sofres-Factum (zde zveřejňují komentované volební preference každých 14 dní)
Stem/Mark (v textu STEM)
Institut pro výzkum veřejného mínění (v textu IVVM)
Trafika
Britské listy
Nevitelný pes
Magyar Gallup Intézet/Maďarská pobočka Gallupovy organizace
a na základě knihy J.Anděl: Statistické metody (MatfyzPress 1998(?))