Je výzkum o cytomegaloviru výsledkem pouhé shody náhod? Opravdu nás virus oblbuje?

Psychická pohoda
Média zaplavila vlna zpráv o viru, kvůli kterému hloupneme. Údajně to prokázal Jaroslav Flegr s týmem z Karlovy univerzity a Státního zdravotního ústavu, jejichž článek vyšel v časopise Nature. Chtěl jsem psát o tom, že jsou mediální zprávy nadnesené, že virus inteligenci snižuje jenom o nepatrný, v běžném životě naprosto zanedbatelný kousíček. Po důkladném pročtení výzkumu si to ale nemyslím: připadá mi, že z výzkumu nic takového nevyplývá a celé je to úplně jinak.

Podle autorů má výzkum prokazovat, že lidé nakažení cytomegalovirem jsou hloupější. Jak sami přiznávají, lze to vysvětlit více způsoby: virus (1) může kazit inteligenci nebo (2) nám naopak vyšší inteligence může pomoci nákaze nepodlehnout nebo podlehnout později, a tak snížit dobu působení viru. Případně (3) může na obojí účinkovat ještě třetí faktor: třeba magická aura, která nás dělá chytřejšími a odolnějšími vůči viru. Nebo něco méně magického, nějaká kombinace genů, vlivů prostředí, vlastností, chování…

Jako měřit kočkopsy
Předpokládejme společně s autory, že druhá ani třetí varianta neplatí. Znamenalo by to, že platí ta první? Představme si, jak takový výzkum funguje, na jednoduchém příkladu: kdybychom měřili, jestli jsou psi větší než kočky. Nestačí porovnat Alíka s Mickou, protože pokud by byl Alík čivava, mohli bychom se snadno zmýlit a konstatovat, že jsou kočky mohutnější. Potřebujeme víc psů a víc koček. Pokud bychom jich měli nekonečno (nebo všechny, kteří kdy žili, žijí a žít budou), mohli bychom spolehlivě prokázat, že jsou psi větší.

Pokud jich ale změříme jen omezený počet, vždycky se může stát, že shodou okolností vybereme samé malé psy a velké kočky – a naše výsledky budou chybné.

Mohlo by vás také zajímat: Souvisí schizofrenie s imunitou a deprese s chronickými záněty? Nový výzkum staví na celostním přístupu

Tak dlouho, než se netrefíme…
Vyšší vzrůst psů tak neumíme vědecky stoprocentně prokázat: pouze zjišťujeme, že je některé vysvětlení velmi pravděpodobné. Vědci se proto domluvili, že za „potvrzené“ přijmeme výsledky, u kterých je maximálně pětiprocentní pravděpodobnost, že k nim došlo náhodou. V praxi to znamená, že kdybychom dvacetkrát vědecky ověřovali vztah, který ve skutečnosti neexistuje, zhruba jednou by nám výsledky jeho existenci mylně potvrdily.

Stěžejní statistika Flegrova týmu přitom nastavenou hranici dalekosáhle překračuje: šance, že se ke svým výsledkům vědci dostali pouhou shodou náhod, je menší než jedna promile. Problém je, že nevíme, kolik virů testovali – a kolikrát testoval cytomegalovirus někdo jiný. Výzkumů probíhá spousta a ty neúspěšné zapadnou. Když Flegrova a další laboratoře na světě opakovaně testují své hypotézy, občas musí zákonitě dojít k pozitivním výsledkům i pouhou náhodou.

Pravděpodobnost získat náhodou výsledky, jakých dosáhli autoři výzkumu, je sice malá, ale pořád větší než možnost, že na kostce padne čtyřikrát za sebou šestka. Hráči Člověče, nezlob se! vědí, že se to občas stane. A jakkoli se to neděje často, nevíme, kolikrát Flegr a další vědci házeli. Navíc nemůžeme vyloučit nějaké nedopatření, které výsledky zkresluje – takže šestky mohou z nějakých důvodů padat častěji. Pomiňme nyní i tyto pochyby, přijměme, že o náhodu nešlo. Co by to znamenalo?

Neviditelné kočky
Lidé, kteří jsou dlouho nakaženi virem, skórují v jistém „testu inteligence“ na dvou ze sedmi dílčích škál o čtyři, respektive dva body lépe. Lépe, nikoli hůře: autoři totiž „nakažení“ měřili hladinou protilátek a tvrdí, že se mezi skupinou „nenakažených“ nachází i 5–10 % těch, kteří jsou nakažení úplně nejdéle, takže jim protilátky už vyprchaly – tedy těch úplně nejhloupějších. Pokud bychom se vrátili k psům a kočkám: autoři tvrdí, že jim kočky vyšly jako větší než psi, protože se jim mezi ně omylem zaběhlo i pár přerostlých bernardýnů.

V datech, která autoři zveřejnili, ale žádné bernardýny najít nemůžu. A že by tam museli být sakra vidět!

Na škále verbálních znalostí, kde se projevil největší rozdíl, dosahovali „nakažení“ průměrného skóre 121, zatímco „nenakažení“ v průměru 117. Pokud je teorie autorů pravdivá a virus skutečně inteligenci snižuje, virem nepostižení lidé by museli dosahovat vyššího skóre než ti postižení (jejichž průměr je 121). Virem opravdu nedotčení by tedy museli mít zhruba 123 (to jsou ty kočky).

Nejhloupější vysokoškoláci světa
Zároveň se mezi ně přimíchalo 5–10 % dlouhodobě nakažených lidí (těch bernardýnů), kteří jejich průměr stahují na zjištěných 117. Pokud přijmeme autory udávané maximum ve výši deset procent, znamenalo by to, že jedna desetina účastníků sníží skóre celé skupiny ze 123 (skutečný průměr) na 117 (průměrná hodnota po přimíchání bernardýnů). Aby toho ale docílila pouhá desetina lidí, musela by mít příslušné skóre kolem šedesáti: na úrovni mentálního postižení.

Jednalo se o vysokoškolské studenty: je možné, aby si u nich nikdo nevšiml, že jsou úplně hloupí? Nevím – nicméně odpověď by měla poskytnout data, která autoři zveřejnili (což je příkladné a skvělé!). V datech ale taková desetina hlupáků chybí: celá skupina se projevuje docela konzistentně, pod sto bodů získali jen tři z respondentů s výsledky 94, 97 a ještě jednou 97.

Když už jsme data stáhli, můžeme hypotézu autorů vyvrátit ještě názorněji. Pokud vezmeme deset procent nejhorších výsledků (ony hypotetické bernardýny) ze skupiny nenakažených a přesuneme je do skupiny nakažených, pořád budou ti zbylí zdraví dosahovat horších výsledků. Hypotéza o tom, že za nižšími výsledky skupiny nenakažených stojí desetina z nich, kteří jsou ve skutečnosti nakažení už velmi dlouho, je chybná.

Přeměřujeme Pražany
Je tedy bernardýnů mezi kočkami víc než deset procent? Aby zdraví lidé dosáhli výsledku 121, jakého dosahovala původní skupina nemocných, museli bychom za nemocné označit 28 % nejhorších z nich. Pro takový zásah do dat ale nemáme žádné opodstatnění. Je to stejný nesmysl, jako kdybychom s touhou prokázat, že jsou kočky větší než psi, z původně náhodného vzorku postupně odebírali všechny velké psy, až by nám zbyli jenom ti zhruba stejně velcí jako kočky.

Navíc to samo o sobě nic nedokazuje: zdraví lidé přeci nemají mít stejné, ale lepší výsledky než ti infikovaní.

Abychom na daném vzorku mohli s přijatelnou pravděpodobností (oněch 5 %, která zmiňuji výše) ukázat, že mají zdraví lidé skutečně větší úspěšnost v dané části IQ testu, museli by dosáhnout průměru aspoň 123. K tomu bychom ale museli z původního vzorku 135 odebrat dalších osmnáct nejhorších lidí.

Jinými slovy: data hypotézu autorů potvrzují, pokud z těch zdravých svévolně vybereme jen něco přes polovinu nejlepších. Pokud to uděláme, je to stejné, jako kdybychom si vybrali průměrné Brňany a vysoké Pražany – a na základě toho chtěli tvrdit, že jsou Češi vyšší než Moraváci. Možná jsou – ale z takových dat na to nelze usuzovat.

Nikoliv, naopak
Data Flegrova týmu naopak naznačují, že to tak není. Pokud si totiž představíme, že by vliv viru byl tak silný, aby kvůli němu bylo možné přesunout skoro polovinu těch, kdo dosahovali nejhorších výsledků, zcela jistě bychom takové případy viděli v datech i bez statistik: bylo by zjevné, že skupina „zdravých“ zahrnuje dvě odlišné podskupiny. Kromě prostého pohledu by taková odlišnost byla vidět i na statistických hodnotách: například by u „smíšené“ skupiny měl být vyšší rozptyl než u konzistentnějších výsledků skupiny, kde jsou nakažení všichni.

Tak to ale není: rozptyl „smíšené“ skupiny je podobný, dokonce trošku menší. A soubor má podle testu docela normální rozložení. Proto musíme hypotézu autorů buď zavrhnout, nebo si říct, že je popisovaný efekt velmi malý, takže na datech není vidět. Zároveň ale víme, že pokud by efekt byl velmi malý, nemohli bychom kvůli němu přesunovat lidi mezi skupinami – takže se takové vysvětlení jeví být nepravděpodobné.

Vrátíme se na začátek
Autoři používají složitější statistiky, které pracují s osmi měřenými dimenzemi inteligence, a naměřené hodnoty navíc matematicky očišťují od vlivů věku a pohlaví, což ve výše nastíněné úvaze nedělám. Příklad s konkrétní dimenzí, u které se naměřený rozdíl projevuje nejvýznačněji, tak sám o sobě nic nevyvrací, slouží jen jako ukázka, proč (nejen) ve mně interpretace autorů vzbuzuje nedůvěru. Pro preciznější kritiku by bylo zapotřebí provést hlubší statistickou analýzu – kterou ale rád přenechám virologům, protože ji nemá smysl provádět bez porozumění mechanismům, které se za naměřenými hodnotami skrývají. Analogické problémy se ovšem v datech skrývají, jen nejsou tak dobře představitelné.

Tváří v tvář naší neschopnosti rozumně vysvětlit, co se za naměřenými výsledky skrývá, bychom se proto měli ptát, jestli všechno není úplně jinak. Můžeme se vrátit na začátek příběhu a ptát se, do jaké míry se za naměřenými výsledky může skrývat nečekaná shoda náhod a okolností nebo další faktory, ona magická aura. A také hledat model, který by výsledky studie vysvětlil lépe než ten, který nabízejí autoři. 

Co jsme to vlastně změřili?
Víme, že vědci pomocí The Intelligence Structure Test (IST) změřili deset různých charakteristik inteligence – a u dvou z nich zjistili, že se droboučce liší. Nevíme ale, proč a jak se liší. V rámci základního výzkumu to může být zajímavé, ale pro běžného člověka takové zjištění žádné důsledky nemá. Naměřený rozdíl mezi skupinami odpovídá dvěma špatným odpovědím během dvouhodinového intenzivního testování.

Z hlediska jednotlivého člověka naprosto zanedbatelná záležitost s dalekonásobně menším vlivem, než jak se před testováním vyspal.

Pro úplnost ještě dodejme, že IST je díky drsnému časovému limitu stresující, takže výsledky ovlivňuje nejen inteligence, ale i pozornost, nervozita a další faktory – a že autoři test používali v rozporu s příslušnými předpisy a manuály, takže lze zpochybňovat i to, jestli vůbec měřili inteligenci, nebo něco úplně jiného. Ale i pokud bychom zůstali u onoho jednoho procenta inteligence, o které se ony dvě skupiny údajně lišily: jaká je jeho role? Ve skutečném životě kromě pozornosti a nervozity působí i nesčetné množství dalších vlivů, které projevy inteligence zásadně zvyšují nebo naopak potlačují, takže úspěch při odpovídání na otázky v IQ testech souvisí se schopností řešit reálné problémy a v něčem uspět jen velmi volně.

Působením viru zkrátka nezhloupneme – a kdyby, tak tak nesmírně málo, že to nikdo nepozná. Pokud naši inteligenci něco ohrožuje, jsou to spíš média, která nafoukla výsledky studie do absurdních výšin, aniž by se vůbec zabývala zjevnými metodologickými chybami.

#VojtechPíšl

Nemoci nechodí po horách, ale po lidech. I když se na ně předem nejde úplně připravit, něco málo se udělat dá… Dali jsme pro vás do kupy speciální microsite s názvem Kolik stojí zdraví. Přečtěte si, jak dlouho trvá průměrná pracovní neschopnost, na jakou podporu od státu máte nárok, když dlouhodobě onemocníte a ve které nemocnici najdete nejlepší specialisty na různé neduhy.

Přečtěte si také: Může mě moje kočka zabít? Nejnovější výzkumy Jaroslava Flegra o toxoplazmóze