Rozdiel medzi rozptylom vzorky a rozptylom populácie

vysvetlenie

V štatistike sa pod pojmom výber vzoriek rozumie výber časti súhrnných štatistických údajov na účely získania relevantných informácií o celku. Súhrnné alebo úplné štatistické informácie o konkrétnom charaktere všetkých členov, ktorých sa vyšetrovanie týka, sa nazýva „populácia“ alebo „vesmír“. (Das, N.G., 2010). Vybraná časť populácie, ktorá sa používa na získanie charakteristík populácie alebo vesmíru, sa nazýva „vzorka“. Počet obyvateľov sa skladá z jednotlivých jednotiek alebo členov a niektoré z jednotiek sú zahrnuté do vzorky. Celkový počet jednotiek populácie sa nazýva veľkosť populácie a veľkosť vzorky sa nazýva veľkosť vzorky. Obyvateľstvo a vzorka môžu byť konečné alebo nekonečné a podobne môžu existovať alebo hypotetické.

odchýlka: Odchýlka je číselná hodnota, ktorá ukazuje, do akej miery sa jednotlivé údaje zo súboru údajov distribuujú o priemere. Takto je každé číslo od priemeru, a teda od seba navzájom. Rozptyl nulovej hodnoty znamená, že všetky údaje sú identické. Čím viac rozptylov, tým viac sú hodnoty rozptýlené o priemere, teda od seba navzájom. Menej rozptylu, menej sú hodnoty rozptýlené o priemere, teda od seba navzájom, a rozptyl nemôže byť negatívny.

Rozdiel medzi rozptylom populácie a rozptylom vzorky

Hlavný rozdiel medzi rozptylom populácie a rozptylom vzorky sa týka výpočtu rozptylu. Odchýlka sa počíta v piatich krokoch. Vypočíta sa prvý priemer, potom vypočítame odchýlky od priemeru a po tretie, odchýlky sa zaokrúhlia na štvorec, po štvrté sa spočítajú odchýlky na druhú a nakoniec sa táto suma vydelí počtom položiek, pre ktoré sa počíta rozptyl. Teda rozptyl = Σ (xi-x -) / n. Kde xi = i. Počet, x- = priemer an = počet položiek…

Teraz, keď sa má rozptyl vypočítať z údajov o populácii, n sa rovná počtu položiek. Ak teda má byť odchýlka krvného tlaku všetkých 1 000 ľudí vypočítaná z údajov o krvných tlakoch všetkých 1 000 ľudí, potom n = 1 000. Keď sa však rozptyl počíta z údajov vzorky 1, musí sa odpočítať od n pred rozdelením súčet druhých odchýliek. Takže v uvedenom príklade, ak údaje zo vzorky majú 100 položiek, menovateľ by bol 100 - 1 = 99.

Z tohto dôvodu je hodnota rozptylu vypočítaná z údajov vzorky vyššia ako hodnota, ktorá sa mohla zistiť pomocou údajov o populácii. Logika toho je kompenzovať nedostatok informácií o údajoch o obyvateľstve. Je nemožné zistiť rozptyl výšok u ľudí, pretože náš absolútny nedostatok informácií o výškach všetkých živých ľudských bytostí nehovorí o budúcnosti. Aj keď vezmeme jeden mierny príklad, ako sú údaje o populácii vo výškach všetkých žijúcich mužov v USA, je to fyzicky možné, ale náklady a čas, ktoré sa na tom podieľajú, by porazili účel jeho výpočtu. To je dôvod, prečo sa údaje zo vzorky odoberajú na väčšinu štatistických účelov, čo je sprevádzané nedostatkom informácií o väčšine údajov. Aby sa to vykompenzovalo, hodnota rozptylu a smerodajná odchýlka, ktorá je druhou odmocninou odchýlky, sú v prípade vzorkovaných údajov vyššie ako rozptyl z populačných údajov..

Toto slúži ako automatický štít pre analytikov a tvorcov rozhodnutí. Logika sa týka rozhodnutí o kapitálovom rozpočte, osobnom a podnikovom financovaní, stavebníctve, riadení dopravy a mnohých uplatniteľných oblastiach. To pomáha zúčastnenej strane byť v bezpečí pri rozhodovaní alebo pri iných záveroch.

Zhrnutie: Populačný rozptyl sa týka hodnoty variancie, ktorá sa počíta z údajov o populácii, a rozptyl vzorky je rozptyl vypočítaný z údajov vzorky. V dôsledku tejto hodnoty menovateľa vo vzorci pre rozptyl je v prípade údajov vo vzorke „n-1“ a pre „populačné údaje“ je „n“. Výsledkom je, že rozptyl aj smerodajná odchýlka odvodená z údajov vzorky sú viac ako odchýlky zistené z údajov o populácii.