Rozdiel medzi štandardnou odchýlkou ​​a štandardnou chybou

úvod

štandardné Dvysťahovanie (SD) a Standard Error (SE) sú zdanlivo podobné terminológie; sú však koncepčne také rozmanité, že sa v štatistickej literatúre používajú takmer zameniteľne. Obidvom výrazom zvyčajne predchádza znak plus-mínus (+/-), čo svedčí o tom, že definujú symetrickú hodnotu alebo predstavujú rozsah hodnôt. Oba termíny sa vždy objavujú s priemerom (priemerom) sady nameraných hodnôt.

Je zaujímavé, že SE nemá nič spoločné s normami, s chybami alebo s poskytovaním vedeckých údajov.

Detailný pohľad na pôvod a vysvetlenie SD a SE odhalí, prečo sa profesionálni štatistici a tí, ktorí ho používajú kurzorom, obaja mýlia..

Štandardná odchýlka (SD)

SD je a opisný štatistika popisujúca šírenie distribúcie. Ako metrika je užitočné, keď sú údaje bežne distribuované. Je však menej užitočné, keď sú údaje veľmi skreslené alebo bimodálne, pretože veľmi dobre nepopisujú tvar distribúcie. Zvyčajne používame pri vykazovaní charakteristík vzorky SD, pretože to chceme popísať koľko sa údaje líšia v priemere. Ďalšími užitočnými štatistickými údajmi na opis šírenia údajov sú medzikvartilové rozpätie, 25. a 75. percentil a rozsah údajov..

Obrázok 1. SD je miera šírenia údajov. Ak sú dáta vzorkou z normálne distribuovanej distribúcie, potom sa očakáva, že dve tretiny údajov budú ležať v rámci jednej štandardnej odchýlky od strednej hodnoty.

Odchýlka je opisný štatistika a je definovaná ako štvorec štandardnej odchýlky. Zvyčajne sa neuvádza pri opise výsledkov, ale je to viac matematicky sledovateľný vzorec (a.k.a. súčet druhých odchýlok) a zohráva úlohu pri výpočte štatistík..

Napríklad, ak máme dve štatistiky P & Q so známymi odchýlkami var(P) & var(Q), potom rozptyl súčtu P + q sa rovná súčtu odchýlok: var(P) +var(Q). Teraz je zrejmé, prečo štatistici radi rozprávajú o variantoch.

Štandardné odchýlky však majú dôležitý význam pre šírenie, najmä ak sú údaje bežne distribuované: Intervalová stredná hodnota +/ - 1 SD dá sa očakávať, že zachytí 2/3 vzorky a stredný interval +- 2 SD Očakáva sa, že zachytí 95% vzorky.

SD udáva, do akej miery sa jednotlivé odpovede na otázku líšia alebo „líšia“ od priemeru. SD hovorí výskumníkovi, aké sú rozšírené odpovede - sú sústredené okolo priemeru alebo sú rozptýlené ďaleko a široko? Hodnotili všetci vaši respondenti váš produkt v strede vašej stupnice, alebo ho niektorí schválili a niektorí nesúhlasili?

Zvážte experiment, pri ktorom sú respondenti požiadaní, aby ohodnotili produkt podľa radu atribútov v päťbodovej stupnici. Priemer pre skupinu desiatich respondentov (označených „A“ až „J“ nižšie) pre „dobrú hodnotu za peniaze“ bol 3,2 s SD 0,4 a priemer pre „spoľahlivosť produktu“ bol 3,4 s SD s 2,1.

Na prvý pohľad (pri pohľade iba na prostriedky) sa zdá, že spoľahlivosť bola hodnotená vyššie ako hodnota. Vyššia SD pre spoľahlivosť by však mohla naznačovať (ako je uvedené v distribúcii nižšie), že odpovede boli veľmi polarizované, kde väčšina respondentov nemala žiadne problémy so spoľahlivosťou (hodnotí sa atribút 5), ale menší, ale dôležitý segment respondentov mal problém so spoľahlivosťou a hodnotil atribút „1“. Keď sa pozrieme na samotnú priemernú hodnotu, vypíšeme iba časť príbehu, na čo sa však výskumníci častejšie než ne zameriavajú. Je dôležité vziať do úvahy distribúciu odpovedí a SD poskytuje hodnotné opisné opatrenie.

odporca Dobrá hodnota za peniaze Spoľahlivosť produktu
3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
ja 3 5
J 3 5
Priemerný 3.2 3.4
Std. dev. 0.4 2.1

Prvý prieskum: Respondenti hodnotia produkt na 5-bodovej stupnici

Dve veľmi odlišné distribúcie odpovedí na 5-bodovú hodnotiacu stupnicu môžu poskytnúť rovnaký priemer. Zoberme si nasledujúci príklad ukazujúci hodnoty odozvy pre dve rôzne hodnotenia.

V prvom príklade (hodnotenie „A“) je SD nula, pretože VŠETKY odpovede boli presne priemernou hodnotou. Jednotlivé reakcie sa vôbec neodchyľovali od priemeru.

V hodnotení „B“ je priemerná odchýlka vyššia, aj keď je priemer skupiny rovnaký (3,0) ako pri prvom rozdelení. Štandardná odchýlka 1,15 ukazuje, že jednotlivé reakcie boli v priemere * o niečo viac ako 1 bod od priemeru.

odporca Hodnotenie „A“ Hodnotenie „B“
3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
ja 3 4
J 3 5
Priemerný 3.0 3.0
Std. dev. 0.00 1.15

Druhý prieskum: Respondenti hodnotia produkt na 5-bodovej stupnici

Ďalším spôsobom pohľadu na SD je vykreslenie distribúcie ako histogram odpovedí. Distribúcia s nízkou SD by sa zobrazila ako vysoký úzky tvar, zatiaľ čo veľká SD by bola označená širším tvarom.

SD vo všeobecnosti neoznačuje „správne alebo nesprávne“ alebo „lepšie alebo horšie“ - nižšia SD nie je nevyhnutne žiaducejšia. Používa sa čisto ako popisná štatistika. Opisuje rozdelenie vo vzťahu k priemeru.

Technické vyhlásenie o vylúčení zodpovednosti týkajúce sa SD

Myslenie na SD ako na „priemernú odchýlku“ je vynikajúci spôsob koncepčného pochopenia jeho významu. V skutočnosti sa však nevypočítava ako priemer (ak by bol, nazvali by sme to „priemerná odchýlka“). Namiesto toho je „štandardizovaný“, čo je trochu zložitá metóda výpočtu hodnoty pomocou súčtu štvorcov.

Z praktických dôvodov nie je výpočet dôležitý. Väčšina tabulkových programov, tabuliek alebo iných nástrojov na správu údajov vypočíta SD za vás. Dôležitejšie je pochopiť, čo sprostredkujú štatistiky.

Štandardná chyba

Štandardná chyba je inferential štatistika, ktorá sa používa pri porovnaní priemerov vzoriek medzi populáciami. Je to opatrenie presnosť priemeru vzorky. Vzorový priemer je štatistika odvodená z údajov, ktoré majú podkladové rozdelenie. Nemôžeme to vizualizovať rovnakým spôsobom ako údaje, pretože sme vykonali jeden experiment a mali iba jednu hodnotu. Štatistická teória nám hovorí, že priemer vzorky (pre veľkú „dosť“ vzorku a za niekoľkých podmienok pravidelnosti) je približne normálne distribuovaný. Štandardnú odchýlku tohto normálneho rozdelenia nazývame štandardná chyba.

Obrázok 2. Distribúcia v dolnej časti sa opakujerozosiela distribúciu údajov, zatiaľ čo distribúcia hore je teoretická distribúcia priemeru vzorky. SD 20 je mierou šírenia údajov, zatiaľ čo SE 5 je mierou neistoty okolo priemeru vzorky.

Ak chceme porovnať priemery výsledkov z dvojvzorového experimentu Liečba A verzus Liečba B, potom musíme odhadnúť, ako presne sme zmerali prostriedky.

V skutočnosti nás zaujíma, ako presne sme zmerali rozdiel medzi týmito dvoma prostriedkami. Toto opatrenie nazývame štandardná chyba rozdielu. Možno vás neprekvapuje, keď zistíte, že štandardná chyba rozdielu vo vzorke je funkciou štandardnej chyby prostriedku:

Teraz, keď ste pochopili, že štandardná chyba priemeru (SE) a štandardná odchýlka distribúcie (SD) sú dve rôzne šelmy, možno vás zaujíma, ako sa v prvom rade zmätili. Hoci sa líšia koncepčne, majú jednoduchý vzťah matematicky:

,kde n je počet údajových bodov.

Všimnite si, že štandardná chyba závisí od dvoch komponentov: štandardnej odchýlky vzorky a veľkosti vzorky n. To dáva intuitívny zmysel: čím väčšia je štandardná odchýlka vzorky, tým menej presný je náš odhad pravého priemeru..

Čím väčšia je veľkosť vzorky, tým viac informácií máme o populácii a presnejšie môžeme odhadnúť skutočný priemer.

SE je znakom spoľahlivosti priemeru. Malá SE je znakom toho, že priemer vzorky je presnejším odrazom skutočného priemeru populácie. Väčšia veľkosť vzorky bude zvyčajne viesť k menšej SE (zatiaľ čo SD nie je priamo ovplyvnená veľkosťou vzorky).

Väčšina výskumných prieskumov zahŕňa výber vzorky z populácie. Potom urobíme závery o populácii z výsledkov získaných z tejto vzorky. Ak bola nakreslená druhá vzorka, výsledky sa pravdepodobne nebudú presne zhodovať s prvou vzorkou. Ak priemerná hodnota pre atribút hodnotenia bola 3,2 pre jednu vzorku, mohla by to byť 3,4 pre druhú vzorku rovnakej veľkosti. Keby sme mali z našej populácie čerpať nekonečný počet vzoriek (rovnakej veľkosti), mohli by sme pozorované prostriedky zobraziť ako rozdelenie. Potom by sme mohli vypočítať priemer všetkých našich vzorkových prostriedkov. Tento priemer by sa rovnal skutočnému priemeru populácie. Môžeme tiež vypočítať SD distribúcie vzoriek prostriedkov. SD tohto rozdelenia prostriedkov vzorky je SE každého priemeru jednotlivých vzoriek.

Máme teda naše najvýznamnejšie zistenie: SE je SD priemeru populácie.

vzorka Priemerný
1. 3.2
2. 3.4
3. 3.3
4. 3.2
5. 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Priemerný 3.3
Std. dev. 0.13

Tabuľka ilustrujúca vzťah medzi SD a SE

Teraz je jasné, že ak nám SD tejto distribúcie pomôže pochopiť, ako ďaleko je priemer vzorky od skutočného priemeru populácie, potom môžeme použiť na pochopenie toho, ako presný je priemer každej vzorky vo vzťahu k skutočnému priemeru. To je podstata SE.

V skutočnosti sme z našej populácie čerpali iba jednu vzorku, ale tento výsledok môžeme použiť na odhad spoľahlivosti priemeru našej pozorovanej vzorky..

V skutočnosti nám SE hovorí, že si môžeme byť na 95% istí, že náš pozorovaný priemer vzorky je plus alebo mínus zhruba 2 (skutočne 1,96) štandardných chýb z priemeru populácie..

Nasledujúca tabuľka zobrazuje rozdelenie odpovedí z našej prvej (a iba) vzorky použitej v našom výskume. Hodnota SE 0,13, ktorá je relatívne malá, naznačuje, že náš priemer je relatívne blízko skutočnému priemeru našej celkovej populácie. Rozpätie chyby (pri 95% spoľahlivosti) pre náš priemer je (zhruba) dvojnásobok tejto hodnoty (+/- 0,26), čo znamená, že skutočný priemer je s najväčšou pravdepodobnosťou medzi 2,94 a 3,46.

odporca Rating
3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
ja 3
J 3
Priemerný 3.2
Std. chybovať 0.13

zhrnutie

Mnoho výskumníkov nechápe rozdiel medzi štandardnou odchýlkou ​​a štandardnou chybou, aj keď sú bežne zahrnutí do analýzy údajov. Zatiaľ čo skutočné výpočty pre štandardnú odchýlku a štandardnú chybu vyzerajú veľmi podobne, predstavujú dve veľmi odlišné, ale doplnkové opatrenia. SD nám hovorí o tvare distribúcie, o tom, ako blízko sú jednotlivé hodnoty údajov od priemernej hodnoty. SE nám hovorí, ako blízko je náš priemerný priemer vzorky skutočnému priemeru celej populácie. Spoločne pomáhajú poskytnúť ucelenejší obraz, ako nám môže povedať iba priemer.