Jak na test Chí-kvadrát v Excelu?

Test Chí-kvadrát je test podobný testu ANOVA, ale používá se tam, kde analyzujeme vliv neměřitelné veličiny (atributu) na výsledek, který je taky neměřitelnou veličinou. Například "shodný/neshodný výrobek". Opět nabízím návod, jak si poradit bez statistického softwaru jen s Excelem.

Zadání příkladu

Součástka od 5 dodavatelů (A, B, C, D, E). Testujeme vzorky (dobrý/špatný). Na hladině významnosti alfa=5% rozhodněte, zda existuje statisticky významný rozdíl mezi výrobci kondenzátorů.

Postup

Dílčí součty a tabulka teoretických četností eij

Spočítáme součty řádků nj (na obr. modře) a sloupců ni (na obr. žlutě). Součet všech prvků je pak n (na obr. zeleně). Následně vytvoříme tabulku teoretických četnosti (to jsou takové, při kterých by platilo, že rozdíl mezi A, B, C...E je nevýznamný. Teoretické hodnoty eij spočítáme dle vzorce:

eij = (ni * nj)/n

např. pro e1,1, tj. buňku C9 (do vzorce dostadíte "žlutý součet pod buňkou" krát "modrý součet vpravo" lomeno "zelený součet všech":

= C$5*$H3/$H$5

Tabulka testovacího kritéria Kij

Dále vytvoříme tabulku testovacích kritérií Kij jako kvadratickou odchylku teoretické a pozorované četnosti lomeno teoretickou četností:

= (nij - eij)2/eij

např. pro K1,1, tj. buňku C14 je vzorec:

= (C3-C9)^2/C9

Vyhodnocení

Spočítáme tzv. hodnotu "chí-kvadrát" (anglicky Chi-quare) jako součet všech Kij. Na obrázku v oranžovém poli.

= SUMA(C14:G15)

A vyhodnotíme pravděpodobnost, že by daná hodnota "chí-kvadrát" nastala jen vlivem mnoha náhodných faktorů, tj. pravděpodobnost, že vliv dodavatelů A, B....E je nevýznamný.

K tomu využijeme funkci =CHIDIST("hodnota chí-kvadrát"; "počet stupňů volnosti"). Počet stupňů volnosti je počet variant A,B...E mínus 1, tj. = 5 - 1 = 4.

= CHIDIST(C17;4)

Výsledek je 0,012, tj. asi 1%. To je méně než obvyklé kritérium posuzování hypotéz (5%). 

Závěr: 

Je menší pravděpodobnost než 5% (konkrétně 1,12%), že by takovéto četnosti měření vznikly "náhodou" (tj. vlivem jen mnoha malých neidentifikovatelných příčin), proto nultou hypotézu, že jsou proměnné nezávislé zamítáme a přijmeme alternativní hypotézu.

Alternativní hypotéza je: Statisticky významný vliv dodavatele na výsledek existuje a výsledky měření lze brát jako relevantní.

2007 - 2017 © Ing. Vladimír Volko - poradenství pro zvyšování výkonnosti podniku