Statistika se těší pochybnému vyznamenání tím, že je nejvíce nepochopeným vědním oborem. Neznamená to však, že je nejméně známá. Nepochopení nějaké věci totiž předpokládá, že se o ní něco ví, nebo přinejmenším se myslí, že se ví. O statistice však panuje všeobecné mínění, že z každého, kdo se naučil ve škole trochu počítat, lze bez obtíží udělat statistika prostě tím, že se mu tak říká.
H. Levinson
Lékaři i výzkumní pracovníci v biologii a medicíně se často domnívají, že hlubší znalosti statistické metodologie nejsou nezbytné. Vždyť spočítat základní charakteristiky dat a t test je jednoduché a vše složitější obstará statistik a počítač. Důvodů, proč si myslíme, že tomu tak není, je několik.
Zamysleme se nad častým znevažováním významu statistiky, například výroky typu: Jsou tři druhy lži: lež prostá, lež odsouzeníhodná a statistika, které naznačují, že statistika je zvlášť rafinovanou formou lži. Tento obecně rozšířený názor je však podivuhodným způsobem spojen se zcela opačným postojem, totiž že statistické výsledky se zároveň považují za vrchol nevyvratitelného, neboť mají magické kouzlo matematické přesnosti. Vždyť co může být přesvědčivějšího než číselný údaj, často získaný složitými výpočty na dnešních počítačích?
Kde hledat kořeny tohoto zvláštního postoje ke statistice? Mohou za to především dvě skutečnosti: za prvé nedostatečná znalost cílů, metod a možností statistiky, a za druhé, že za statistiku se pokládá i to, co je ve skutečnosti pseudostatistikou. Protože vládne mylný názor, že pro statistické zpracování dat postačují jen obstojné znalosti z matematiky, stává se tak statistika polem působení mnoha amatérů. Výsledek jejich práce pak vnáší do biologie a medicíny nesprávné statistické závěry. Proto je v posledních letech čím dal větší pozornost v renomovaných lékařských a biologických časopisech věnována i kvalitě statistického zpracování.
Náš výklad poskytne zájemcům úvod do myšlenkových základů a rutinních postupů statistiky, neboť dnešní statistika se již zdaleka neomezuje na prostý popis nashromážděných dat, ale umožňuje zobecňovat poznatky z dat a podporovat rozhodování.
Původní význam slova statistika souvisí se státem, s jeho administrativním spravováním, kdy docházelo k zaznamenávání údajů k vojenským a daňovým účelům. I dnes slovo statistika vyjadřuje popis souboru či jeho sumarizaci, například statistika nemocnosti nebo statistika zdravotnických služeb. V tomto smyslu funguje například Český statistický úřad. Sbírá některé údaje o všech nemocnicích, o všech obcích, dělá úplný popis zvoleného souboru statistických jednotek. Popisná (deskriptivní) statistika se zabývá uspořádáním souborů, jejich popisem a účelnou sumarizací.
Problém vědeckého myšlení je spjat s hledáním pravdy. Na čem je vlastně založen náš závěr, že něco je pravdivé? Máme dva hlavní prostředky, které v procesu vytváření vědeckých závěrů používáme. Jsou to hlavně pozorování vnějšího světa a naše schopnosti vytvářet z těchto pozorování zobecňující poznatky. Například při sledování účinku léku na hodnotu krevního tlaku u nemocných s hypertenzní chorobou nelze přeměřit všechny nemocné v naší populaci. Místo celého souboru nemocných se vyšetří jen určitý vzorek nemocných s hypertenzní chorobou (výběr) a z těchto pozorování se snažíme odvodit závěry pro všechny pacienty trpící hypertenzní chorobou (populaci), kteří jsou použitým vzorkem reprezentováni.
Proces zobecňování poznatků, například přenášením závěrů z výběru na celou populaci, nazýváme induktivním způsobem usuzování (indukcí). Induktivní způsob myšlení má prvořadý význam pro postavení člověka v reálném světě. Schopnost učit se ze zkušenosti umožňuje lidem včas se přizpůsobit měnícím se životním podmínkám. Je jedním ze základních typů lidského myšlení, přičemž druhým základním typem je deduktivní myšlení (dedukce). Při deduktivním myšlení z obecných zákonitostí (teorie) činíme závěry (predikce) pro jednotlivé případy (pozorování). Toto myšlení nalézá své uplatnění zejména v matematice. Imponující nezvratnost deduktivních důkazů je však dosahována za cenu toho, že nic nevypovídají o reálném světě. Praktický význam nabývá deduktivní myšlení jen jako článek myšlenkového řetězce, ve kterém se uplatňují i jiné typy myšlení. Na obrázku 1.1 je znázorněn základní rozdíl mezi deduktivním a induktivním myšlením.
Závěry induktivních myšlenkových pochodů jsou však ovlivněny subjektivními postoji a mají pouze omezenou platnost. Induktivní statistika se zabývá metodami jak takové poznatky přenášet a umožňuje z pozorovaných dat vytvářet obecné závěry s udáním stupně jejich spolehlivosti. Výpočet stupně spolehlivosti závěrů je však objektivní, neboť je založen na poznatcích teorie pravděpodobnosti a nezávisí na subjektivním názoru hodnotitele.
Hlavní roli v metodách induktivní statistiky hrají dva důležité pojmy - populace a výběr.
Populace (základní soubor) je zadána přesným stanovením jejích prvků. Prvky jsou buď dány výčtem, nebo vymezením některých společných vlastností. U demografických souborů bývá vymezení dáno příslušností k jisté územní oblasti, věkem, pohlavím, zaměstnáním nebo časovým intervalem sledování (například všechny děti narozené v roce 1990 a k 1. 1. 1998 žijící na území ČR). Vymezená populace může mít konečný rozsah (obecně značíme symbolem N), jak je tomu u všech demografických souborů, nebo nekonečný rozsah. Nekonečný rozsah mají hypotetické populace, vymezené vlastnostmi svých prvků (například přejeme-li si změřit hladinu cholesterolu ve vzorku krve, pak bychom teoreticky mohli měřit vzorek nekonečněkrát). Parametr (populační charakteristika) je číselná charakteristika populace, např. průměrná výška osmiletých dívek v ČR. Je obvykle pokládán za pevné číslo, ale jeho hodnota je obecně neznámá.
Informace o populaci získáváme prostřednictvím statistického výzkumu. Je užitečné rozlišovat mezi dvěma typy statistických studií - pokusem a šetřením.
V pokusu plánovitě měníme faktory (či jejich hladiny, úrovně) a sledujeme jejich vliv. Jasným příkladem klinického pokusu je srovnávací studie účinků chirurgické a konzervativní léčby určitého onemocnění. Pacienty náhodně rozdělíme do dvou skupin, z nichž jednu léčíme chirurgicky a druhou konzervativně. Výsledky léčby vzájemně porovnáme. Podobně, pro zjištění účinku vitaminu C na určité virové onemocnění, nemocné náhodně rozdělíme do dvou skupin. Pouze jedné skupině podáváme vitamin C. Tento typ klinického pokusu nazýváme kontrolovaný pokus. Jestliže lékař při vyhodnocování účinku léčby neví, kteří pacienti vitamin C dostávali, jde o slepý pokus. V případě, že ani lékař ani pacienti nevědí, kdo vitamin C dostával (u kontrolní skupiny je podáváno placebo), jde o dvojitě slepý pokus.
Při statistickém šetření je výzkumný pracovník pouze pasivním pozorovatelem, který zasahuje co nejméně do průběhu šetření. Sledujeme-li znaky u všech prvků (jednotek statistického šetření) populace, provádíme úplné šetření. Příkladem úplného šetření na demografických souborech je provádění soupisů, např. soupis pacientů v lůžkových zařízeních. Soupis se provádí vždy k určitému rozhodnému okamžiku a je třeba jej pečlivě organizačně připravit. Pro soupis obyvatelstva se vžil název sčítání lidu (census) a v našich zemích se provádí v přibližně desetiletých intervalech. Úplné šetření také provádíme při evidenci povinně hlášených nemocí nebo při sledování důležitých demografických jevů, jako je narození nebo úmrtí. Úplné šetření provádíme v praxi poměrně zřídka. Vzhledem ke stanoveným cílům bývá úplné šetření na rozsáhlejších populacích organizačně, ekonomicky a časově tak náročné, že je nelze uskutečnit. Proto zpravidla přistupujeme k výběrovému šetření. Při výběrovém šetření zjišťujeme požadované vlastnosti pouze u některých prvků populace, které vytvářejí výběr (viz obrázek 1.2). Počet prvků ve výběru neboli rozsah výběru obecně označujeme symbolem n.
Pokud zkoumaný výběr dobře odráží strukturu celého zkoumaného souboru, nazýváme jej reprezentativním výběrem. Za určitých předpokladů můžeme závěry z výběrů pomocí statistické indukce zobecňovat na celou populaci. Jak již bylo řečeno, induktivní závěry jsou provázeny určitou nejistotou. Metody statistické indukce umožňují však objektivně vyjádřit míru nejistoty zobecněných závěrů pomocí počtu pravděpodobnosti.
Vlastnosti, sledované na prvcích (jednotkách statistického šetření) výběru či populace, nazýváme znaky (veličiny). Znaky, které sledujeme, dělíme na kvalitativní a kvantitativní. Jsou-li varianty zkoumané vlastnosti dány slovním vyjádřením, jde o znak kvalitativní. Jsou-li varianty vyjádřeny číslem, jde o znak kvantitativní. Kvantitativní znak je buď spojitý, jestliže jednotlivé varianty znaku mohou nabývat jakékoliv hodnoty z určitého intervalu nebo rozmezí (výška, hmotnost apod.), či diskrétní (nespojitý), jsou-li varianty znaku vyjádřeny oddělenými čísly (počet onemocnění, počet zemřelých apod.). Kvantitativní znaky měříme na intervalové nebo poměrové stupnici. Tyto stupnice umožňují nejen uspořádat pozorování vzhledem ke stupni vyšetřované vlastnosti, ale navíc určují jejich přesnou vzdálenost.
Na intervalové stupnici je nulová pozice věcí volby. Příkladem měření na této stupnici je teplota ve stupních Celsia nebo libovolná kalendářní stupnice.
Nulová pozice na poměrové stupnici je pevně dána a vyjadřuje naprostou nepřítomnost měřené vlastnosti. Měřením na této stupnici je hmotnost v kg, příjem v Kč nebo ukazatel úmrtnosti (počet zemřelých na 1 000 exponovaných). Na rozdíl od intervalové stupnice při porovnání dvou hodnot na poměrové stupnici má smysl se ptát, kolikrát je první hodnota větší než druhá.
Pojem měření bývá často rozšiřován i na kvalitativní znaky. K měření kvalitativních znaků používáme nominální nebo ordinální (pořadovou) stupnici. Vlastnosti uvedených dvou stupnic popíšeme nyní podrobněji.
Nominální stupnice sestává ze dvou či více vzájemně se vylučujících kategorií (tříd). V případě, že kategorie jsou právě dvě, stupnice se nazývá dichotomická. Příklady kvalitativních znaků měřených na nominální stupnici jsou: rodinný stav muže s kategoriemi {svobodný, ženatý, rozvedený, vdovec}; pohlaví s kategoriemi {muž, žena}; operace žaludku s kategoriemi {resekce pro vřed, resekce pro karcinom, jiná radikální, jiná paliativní}. Pro identifikaci tříd nominálních znaků často používáme čísla. Přiřazená čísla jsou ale jen symboly (kódy), které nelze použít pro obvyklé aritmetické operace. Příkladem měření na nominální stupnici je tak i známá mezinárodní klasifikace nemocí, úrazů a příčin smrti. Přiřazená čísla zde jen usnadňují administrativní činnost lékaře a zpracování údajů.
Ordinální stupnice je bohatší než nominální stupnice. Hodnoty znaků jsou seskupeny do neslučitelných kategorií (tříd), které jsou vzájemně uspořádány. Čísla přiřazená kategoriím pro identifikaci odrážejí toto uspořádání, ale neposkytují žádnou informaci o vzdálenosti kategorií. Příklady ordinálních znaků jsou: invalidita s kategoriemi {úplná, částečná, žádná}; bolest hlavy s kategoriemi {často, někdy, zřídka, nikdy}; spokojenost se zdravotnickými službami s kategoriemi {velmi spokojen, spokojen, mírně spokojen, mírně nespokojen, nespokojen, velmi nespokojen}.
Výběry jsou v praxi používány proto, že je jen zřídka možné z důvodů omezeného času či prostředků vyšetřit všechny jednotky uvažované populace. Sčítání lidu, prováděné u nás Českým statistickým úřadem (ČSÚ), je výjimečnou možností vyšetřit celou populaci, i když vyplnění krátkého dotazníku představuje jen velmi nízkou úroveň měření. Pokud by chtěl ČSÚ získat podrobnější informaci o jednotlivcích, dal by přednost práci s výběrem před celou populací, protože výsledná informace by byla dokonce lepší než při zkoumání populace jako celku! Na první pohled to může vypadat poněkud paradoxně, ale po chvíli uvažování se to vyjasní. Zjištění komplexní informace by vyžadovalo vysoce vycvičený sbor tazatelů, který ale pro úplné sčítání lidu není k dispozici. Proto se můžeme o populaci dozvědět více z rozhovorů vedených profesionálními tazateli s reprezentativním výběrem než z rozhovorů s celou populací, které by ale vedli nekompetentní tazatelé.
V některých případech je proces měření destruktivní, takže pokud bychom změřili celou populaci, měli bychom přesnou znalost o ničem, protože bychom ji přitom zničili! Hypotetické populace tvořené měřeními nelze už z podstaty věci vyšetřit úplně - bez ohledu na to, kolik měření jsme provedli na vzorku krve, je to pouze výběr, protože jsme jich mohli, alespoň teoreticky, provést nekonečněkrát více.
Statistika (výběrová charakteristika) je rovněž pojem užívaný pro číselnou charakteristiku výběru, např. průměrná výška 200 náhodně vybraných osmiletých českých dívek. Hodnota téže statistiky bude obvykle v různých výběrech různá.
Výběry pořizujeme metodami náhodného (pravděpodobnostního) výběru, nebo metodami záměrného výběru. Chceme-li z výběru usuzovat na vlastnosti populace, měl by být reprezentativní tj. odrážet svým složením vzhledem ke sledovaným znakům vlastnosti celé populace. Výběr, který není reprezentativní, se nazývá selektivní výběr. Selektivní výběr dává zkreslený obrázek o studované populaci. Příkladem selektivního výběru je vzorek závodně sportujících volejbalistů ve věku 15-16 let, ze kterého chceme činit závěr o výšce v české populaci chlapců ve věku 15-16 let. Příčina selektivity tkví ve skutečnosti, že ve volejbalu se lépe uplatní větší chlapci, a proto je vybraný vzorek volejbalistů odlišný ve struktuře výšky od chlapců v tomto věku v celé české populaci.
Vybírání prvků z populace pomocí záměrného výběru se opírá o expertní stanoviska a různé odhady jak získat reprezentativní výběry. Takto získané výběrové soubory jsou často ovlivněny subjektivními hledisky experta, či dalšími faktory ovlivňujícími pořizované výběry. Přesnost zobecňujících závěrů se spíše opírá o expertní hledisko než o statistickou metodologii.
Metody náhodného výběru umožňují vybírat prvky z populace zcela náhodně a nezávisle na našem úsudku. Oporou (rámcem) výběru nazýváme technickou dokumentaci, která umožňuje proces vybírání, např. různé seznamy, mapy nebo kartotéky pacientů. Podle způsobu provedení rozlišujeme několik druhů náhodného výběru.
Druhy náhodného výběru