Kontakty

Na čo slúži interval spoľahlivosti? Interval spoľahlivosti a pravdepodobnosť spoľahlivosti

Odoberaním vzorky z populácie získame bodový odhad parametra, ktorý nás zaujíma, a vypočítame štandardnú chybu, aby sme naznačili presnosť odhadu.

Vo väčšine prípadov však štandardná chyba ako taká nie je prijateľná. Je oveľa užitočnejšie kombinovať túto mieru presnosti s intervalovým odhadom pre parameter populácie.

To sa dá urobiť pomocou znalosti teoretického rozdelenia pravdepodobnosti štatistickej vzorky vzorky (parametra) na výpočet interval spoľahlivosti(CI- Interval spoľahlivosti, DI - Interval spoľahlivosti) pre parameter.

Vôbec, interval spoľahlivosti rozširuje odhady v oboch smeroch o určitý násobok štandardnej chyby (daného parametra); dve hodnoty (limity spoľahlivosti), ktoré definujú interval, sú zvyčajne oddelené čiarkou a uzavreté v zátvorkách.

V štatistike a interval spoľahlivosti(CI) je typ intervalového odhadu parametra populácie. Je to pozorovaný interval (t. j. vypočítaný z pozorovaní), v princípe odlišný od vzorky k vzorke, ktorý často zahŕňa hodnotu nepozorovateľného parametra záujmu, ak sa experiment opakuje. Ako často sledovaný interval obsahuje parameter je určené úrovňou spoľahlivosti alebo koeficientom spoľahlivosti. Presnejšie povedané, význam termínu „úroveň spoľahlivosti“ je taký, že ak je CI konštruovaná naprieč mnohými samostatnými analýzami údajov z replikovaných (a možno odlišných) experimentov, podiel takýchto intervalov, ktoré obsahujú skutočnú hodnotu parametra, sa bude zhodovať s daným úroveň sebavedomia. Zatiaľ čo obojstranné medze spoľahlivosti tvoria interval spoľahlivosti, ich jednostranné náprotivky sa označujú ako dolné/horné medze spoľahlivosti (alebo limity).


Interval spoľahlivosti ukazuje, v akom rozsahu sa budú nachádzať výsledky výberových pozorovaní (prieskumov). Ak vykonáme 100 identických prieskumov v identických vzorkách z jednej populácie (napríklad 100 vzoriek po 1 000 ľuďoch v meste s 5 miliónmi obyvateľov), potom na úrovni spoľahlivosti 95 % bude 95 zo 100 výsledkov spadať do interval spoľahlivosti (napríklad od 28 % do 32 % so skutočnou hodnotou 30 %). Napríklad skutočný počet obyvateľov mesta, ktorí fajčia, je 30 %. Ak vyberieme 1000 ľudí 100-krát za sebou a v týchto vzorkách položíme otázku „Fajčíš?“, v 95 z týchto 100 vzoriek s 2 % intervalom spoľahlivosti bude hodnota od 28 % do 32 %.

Vzorce na zostavenie intervalov spoľahlivosti s praktickými príkladmi možno nájsť napr.

Interpretácia intervalov spoľahlivosti

Pri interpretácii intervalu spoľahlivosti nás zaujímajú nasledujúce otázky:

Aký široký je interval spoľahlivosti?

Široký interval spoľahlivosti naznačuje, že odhad je nepresný; úzky označuje dobrý odhad.
Šírka intervalu spoľahlivosti závisí od veľkosti štandardnej chyby, ktorá zase závisí od veľkosti vzorky a pri posudzovaní numerickej premennej z variability údajov poskytuje širšie intervaly spoľahlivosti ako štúdie veľkého súboru údajov. niekoľkých premenných.

Obsahuje KI nejaké hodnoty, ktoré sú mimoriadne zaujímavé?

Môžete skontrolovať, či pravdepodobná hodnota parametra populácie spadá do intervalu spoľahlivosti. Ak áno, potom výsledky zodpovedajú tejto pravdepodobnej hodnote. Ak nie, potom je nepravdepodobné (pre 95 % interval spoľahlivosti je šanca takmer 5 %), že parameter má túto hodnotu. ()

Pre veľkú väčšinu jednoduchých meraní je celkom dobre splnený takzvaný normálny zákon náhodných chýb ( Gaussov zákon), odvodené z nasledujúcich empirických ustanovení.

1) chyby merania môžu mať súvislý rad hodnôt;

2) pri veľkom počte meraní sa rovnako často vyskytujú chyby rovnakej veľkosti, ale iného znamienka,

3) čím väčšia náhodná chyba, tým nižšia je pravdepodobnosť jej výskytu.

Graf normálneho Gaussovho rozdelenia je na obr.1. Krivková rovnica má tvar

kde je distribučná funkcia náhodných chýb (chýb), ktorá charakterizuje pravdepodobnosť chyby, σ je stredná kvadratická chyba.

Hodnota σ nie je náhodná veličina a charakterizuje proces merania. Ak sa podmienky merania nezmenia, potom σ zostáva konštantné. Druhá mocnina tejto veličiny je tzv rozptyl meraní.Čím menší rozptyl, tým menší rozptyl jednotlivých hodnôt a tým vyššia presnosť merania.

Presná hodnota strednej kvadratúry chyby σ, ako aj skutočná hodnota meranej veličiny nie je známa. Existuje takzvaný štatistický odhad tohto parametra, podľa ktorého sa stredná štvorcová chyba rovná strednej štvorcovej chybe aritmetického priemeru. Hodnota ktorej je určená vzorcom

kde je vysledok i-tá dimenzia; - aritmetický priemer získaných hodnôt; n je počet meraní.

Čím väčší je počet meraní, tým menší a viac sa približuje k σ. Ak je skutočná hodnota meranej veličiny μ, jej aritmetický priemer získaný ako výsledok meraní a náhodná absolútna chyba, potom sa výsledok merania zapíše ako .

Volá sa interval hodnôt od do, do ktorého spadá skutočná hodnota meranej veličiny μ interval spoľahlivosti. Keďže ide o náhodnú premennú, skutočná hodnota spadá do intervalu spoľahlivosti s pravdepodobnosťou α, ktorá je tzv pravdepodobnosť spoľahlivosti, alebo spoľahlivosť merania. Táto hodnota sa číselne rovná ploche tieňovaného krivočiareho lichobežníka. (pozri obrázok.)

To všetko platí pre dostatočne veľký počet meraní, keď je blízko σ. Na nájdenie intervalu spoľahlivosti a úrovne spoľahlivosti pre malý počet meraní, ktorými sa zaoberáme v priebehu laboratórnych prác, používame Študentovo rozdelenie pravdepodobnosti. Ide o rozdelenie pravdepodobnosti náhodnej premennej tzv Študentský koeficient, udáva hodnotu intervalu spoľahlivosti v zlomkoch strednej kvadratickej chyby aritmetického priemeru.


Rozdelenie pravdepodobnosti tejto veličiny nezávisí od σ 2, ale v podstate závisí od počtu experimentov n. S nárastom počtu experimentov nŠtudentovo rozdelenie má tendenciu ku Gaussovmu rozdeleniu.

Distribučná funkcia je tabuľková (tabuľka 1). Hodnota Studentovho koeficientu je v priesečníku priamky zodpovedajúcej počtu meraní n a stĺpec zodpovedajúci hladine spoľahlivosti α

Výpočet intervalu spoľahlivosti je založený na priemernej chybe zodpovedajúceho parametra. Interval spoľahlivosti ukazuje, v akých medziach s pravdepodobnosťou (1-a) je skutočná hodnota odhadovaného parametra. Tu a je hladina významnosti, (1-a) sa tiež nazýva hladina spoľahlivosti.

V prvej kapitole sme ukázali, že napríklad pre aritmetický priemer leží skutočný priemer populácie v rámci 2 stredných chýb od priemeru asi 95 % času. Hranice 95 % intervalu spoľahlivosti pre priemer teda budú od priemeru vzorky o dvojnásobok strednej chyby priemeru, t.j. vynásobíme strednú chybu priemeru nejakým faktorom, ktorý závisí od úrovne spoľahlivosti. Pre priemer a rozdiel priemerov sa berie študentský koeficient (kritická hodnota študentského kritéria), pre podiel a rozdiel podielov kritická hodnota z kritéria. Súčin koeficientu a priemernej chyby môžeme nazvať hraničnou chybou tohto parametra, t.j. maximum, ktoré môžeme pri jej hodnotení získať.

Interval spoľahlivosti pre aritmetický priemer : .

Tu je vzorový priemer;

Priemerná chyba aritmetického priemeru;

s- vzorová smerodajná odchýlka;

n

f = n-1 (koeficient študenta).

Interval spoľahlivosti pre rozdiel aritmetických priemerov :

Tu je rozdiel medzi vzorovými prostriedkami;

- priemerná chyba rozdielu aritmetických priemerov;

s 1, s 2 - vzorové štandardné odchýlky;

n1, n2

Kritická hodnota študentského kritéria pre danú hladinu významnosti a a počet stupňov voľnosti f=n1 + n2-2 (koeficient študenta).

Interval spoľahlivosti pre akcií :

.

Tu d je podiel vzorky;

– priemerná chyba podielu;

n– veľkosť vzorky (veľkosť skupiny);

Interval spoľahlivosti pre zdieľať rozdiely :

Tu je rozdiel medzi podielmi vzorky;

je stredná chyba rozdielu medzi aritmetickými priemermi;

n1, n2– veľkosti vzoriek (počet skupín);

Kritická hodnota kritéria z na danej hladine významnosti a ( , , ).

Výpočtom intervalov spoľahlivosti pre rozdiel v ukazovateľoch, po prvé, priamo vidíme možné hodnoty efektu, a nielen jeho bodový odhad. Po druhé, môžeme vyvodiť záver o prijatí alebo vyvrátení nulovej hypotézy a po tretie, môžeme urobiť záver o sile kritéria.

Pri testovaní hypotéz pomocou intervalov spoľahlivosti by sa malo dodržiavať nasledujúce pravidlo:

Ak 100(1-a)-percentný interval spoľahlivosti stredného rozdielu neobsahuje nulu, potom sú rozdiely štatisticky významné na hladine významnosti a; naopak, ak tento interval obsahuje nulu, potom rozdiely nie sú štatisticky významné.

Ak totiž tento interval obsahuje nulu, znamená to, že porovnávaný ukazovateľ môže byť viac alebo menej v jednej zo skupín v porovnaní s druhou, t.j. pozorované rozdiely sú náhodné.

Podľa miesta, kde sa v intervale spoľahlivosti nachádza nula, je možné posúdiť silu kritéria. Ak sa nula blíži k dolnej alebo hornej hranici intervalu, potom by možno pri väčšom počte porovnávaných skupín dosahovali rozdiely štatistickú významnosť. Ak je nula blízko stredu intervalu, znamená to, že zvýšenie aj zníženie ukazovateľa v experimentálnej skupine sú rovnako pravdepodobné a pravdepodobne naozaj neexistujú žiadne rozdiely.

Príklady:

Pre porovnanie chirurgickej úmrtnosti pri použití dvoch rôznych typov anestézie: 61 ľudí bolo operovaných pomocou prvého typu anestézie, 8 zomrelo, pri použití druhého - 67 ľudí, 10 zomrelo.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = -0,018.

Rozdiel v letalite porovnávaných metód bude v rozmedzí (-0,018 - 0,122; -0,018 + 0,122) alebo (-0,14; 0,104) s pravdepodobnosťou 100(1-a) = 95 %. Interval obsahuje nulu, t.j. hypotéza o rovnakej úmrtnosti v dvoch odlišné typy narkózu nemožno poprieť.

Úmrtnosť teda môže a bude klesať na 14 % a zvyšovať na 10,4 % s pravdepodobnosťou 95 %, t.j. nula je približne v strede intervalu, takže možno tvrdiť, že s najväčšou pravdepodobnosťou sa tieto dve metódy skutočne nelíšia v letalite.

V príklade, ktorý sme uvažovali vyššie, sa porovnával priemerný čas poklepania v štyroch skupinách študentov, ktoré sa líšili v skóre zo skúšky. Vypočítajme intervaly spoľahlivosti priemerného času lisovania pre študentov, ktorí absolvovali skúšku na 2 a 5 a interval spoľahlivosti pre rozdiel medzi týmito priemermi.

Študentove koeficienty zistíme z tabuliek Studentovho rozdelenia (pozri prílohu): pre prvú skupinu: = t(0,05;48) = 2,011; pre druhú skupinu: = t(0,05;61) = 2,000. Intervaly spoľahlivosti pre prvú skupinu teda: = (162,19-2,011 * 2,18; 162,19 + 2,011 * 2,18) = (157,8; 166,6) , pre druhú skupinu (156,55- 2,000*1,828) = 151085 + 151085 160,3). Takže pre tých, ktorí zložili skúšku na 2, sa priemerný čas lisovania pohybuje od 157,8 ms do 166,6 ms s pravdepodobnosťou 95%, pre tých, ktorí zložili skúšku na 5 - od 152,8 ms do 160,3 ms s pravdepodobnosťou 95% .

Môžete tiež testovať nulovú hypotézu pomocou intervalov spoľahlivosti pre priemery, nielen pre rozdiel v priemeroch. Napríklad, ako v našom prípade, ak sa intervaly spoľahlivosti pre priemery prekrývajú, nulovú hypotézu nemožno zamietnuť. Aby bolo možné zamietnuť hypotézu na zvolenej hladine významnosti, príslušné intervaly spoľahlivosti sa nesmú prekrývať.

Nájdite interval spoľahlivosti pre rozdiel v priemernom čase lisovania v skupinách, ktoré absolvovali skúšku na 2 a 5. Rozdiel v priemeroch: 162,19 - 156,55 = 5,64. Študentov koeficient: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Skupinové štandardné odchýlky sa budú rovnať: ; . Vypočítame priemernú chybu rozdielu medzi priemermi:. Interval spoľahlivosti: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Takže rozdiel v priemernom čase lisovania v skupinách, ktoré zložili skúšku v 2 a 5, bude v rozsahu od -0,044 ms do 11,33 ms. Tento interval zahŕňa nulu, t.j. priemerný čas lisovania u tých, ktorí zvládli skúšku s výborným výsledkom, sa môže v porovnaní s tými, ktorí skúšku zložili neuspokojivo, zvýšiť aj znížiť, t.j. nulovú hypotézu nemožno zamietnuť. Ale nula je veľmi blízko spodnej hranice, čas stláčania sa u výborných rozohrávačov skráti oveľa skôr. Môžeme teda konštatovať, že stále existujú rozdiely v priemernom čase kliknutia medzi tými, ktorí prešli o 2 a o 5, len sme ich nedokázali zistiť pre danú zmenu priemerného času, rozptylu priemerného času a veľkosti vzoriek.

Sila testu je pravdepodobnosť zamietnutia nesprávnej nulovej hypotézy, t.j. nájsť rozdiely tam, kde skutočne sú.

Sila testu sa určuje na základe úrovne významnosti, veľkosti rozdielov medzi skupinami, rozptylu hodnôt v skupinách a veľkosti vzorky.

Pre Studentov t-test a analýzu rozptylu môžete použiť grafy citlivosti.

Pri predbežnom určení možno použiť silu kritéria potrebné číslo skupiny.

Interval spoľahlivosti ukazuje, v ktorých medziach leží skutočná hodnota odhadovaného parametra s danou pravdepodobnosťou.

Pomocou intervalov spoľahlivosti môžete testovať štatistické hypotézy a vyvodzovať závery o citlivosti kritérií.

LITERATÚRA.

Glantz S. - Kapitola 6.7.

Rebrová O.Yu. - s.112-114, s.171-173, s.234-238.

Sidorenko E. V. - s. 32-33.

Otázky na samoskúšanie žiakov.

1. Aká je sila kritéria?

2. V akých prípadoch je potrebné vyhodnotiť silu kritérií?

3. Metódy výpočtu výkonu.

6. Ako testovať štatistickú hypotézu pomocou intervalu spoľahlivosti?

7. Čo možno povedať o sile kritéria pri výpočte intervalu spoľahlivosti?

Úlohy.

Zapíšte si úlohu. Napríklad: Priemerná váha študenta na ABC University je 90 kg. Otestujete presnosť predikcie hmotnosti študentov mužského pohlavia na univerzite ABC v rámci daného intervalu spoľahlivosti.

Urobte vhodnú vzorku. Budete ho používať na zber údajov na testovanie hypotéz. Povedzme, že ste už náhodne vybrali 1 000 študentov mužského pohlavia.

Vypočítajte priemer a smerodajnú odchýlku tejto vzorky. Vyberte štatistiky(napríklad priemer a štandardná odchýlka), ktoré chcete použiť na analýzu vzorky. Tu je návod, ako vypočítať priemer a štandardnú odchýlku:

  • Ak chcete vypočítať priemer vzorky, pridajte hmotnosti 1 000 mužov vo vzorke a výsledok vydeľte 1 000 (počet mužov). Povedzme, že sme dostali priemernú hmotnosť 93 kg.
  • Ak chcete vypočítať štandardnú odchýlku vzorky, musíte nájsť priemernú hodnotu. Potom musíte vypočítať rozptyl údajov alebo priemer štvorcových rozdielov od priemeru. Keď toto číslo nájdete, vezmite z neho druhú odmocninu. Povedzme, že v našom príklade je štandardná odchýlka 15 kg (všimnite si, že niekedy môže byť táto informácia uvedená spolu s podmienkou štatistického problému).
  • Vyberte požadovanú úroveň spoľahlivosti. Najčastejšie používané úrovne spoľahlivosti sú 90 %, 95 % a 99 %. Môže sa podávať aj spolu so stavom problému. Povedzme, že ste si vybrali 95 %.

  • Vypočítajte mieru chyby. Medzeru chýb môžete nájsť pomocou nasledujúci vzorec: Z a/2 * σ/√(n). Z a/2 = faktor spoľahlivosti (kde a = úroveň spoľahlivosti), σ = štandardná odchýlka a n = veľkosť vzorky. Tento vzorec ukazuje, že musíte vynásobiť kritickú hodnotu štandardnou chybou. Tu je návod, ako môžete vyriešiť tento vzorec jeho rozdelením na časti:

    • Vypočítajte kritickú hodnotu alebo Z a/2. Úroveň spoľahlivosti je 95 %. Preveďte percento na desatinné číslo: 0,95 a vydeľte 2, aby ste dostali 0,475. Potom sa pozrite do tabuľky Z-skóre a nájdite zodpovedajúcu hodnotu pre 0,475. Nájdete hodnotu 1,96 (na priesečníku riadku 1,9 a stĺpca 0,06).
    • Vezmite štandardnú chybu (štandardnú odchýlku): 15 a vydeľte ju druhou odmocninou veľkosti vzorky: 1000. Získate: 15/31,6 alebo 0,47 kg.
    • Vynásobte 1,96 x 0,47 (kritická hodnota na štandardnú chybu), aby ste dostali 0,92, čo je hranica chyby.
  • Zapíšte si interval spoľahlivosti. Ak chcete sformulovať interval spoľahlivosti, jednoducho zapíšte priemer (93) ± chyba. Odpoveď: 93 ± 0,92. Hornú a dolnú hranicu intervalu spoľahlivosti môžete nájsť pripočítaním a odčítaním chyby od priemeru. Spodná hranica je teda 93 – 0,92 alebo 92,08 a horná hranica 93 + 0,92 alebo 93,92.

    • Na výpočet intervalu spoľahlivosti môžete použiť nasledujúci vzorec: x̅ ± Z a/2 * σ/√(n), kde x̅ je stredná hodnota.
  • Interval spoľahlivosti k nám prišiel z oblasti štatistiky. Toto je definovaný rozsah, ktorý slúži na odhad neznámeho parametra vysoký stupeň spoľahlivosť. Najjednoduchšie sa to dá vysvetliť na príklade.

    Predpokladajme, že potrebujete preskúmať nejakú náhodnú premennú, napríklad rýchlosť odpovede servera na požiadavku klienta. Zakaždým, keď používateľ zadá adresu konkrétnej lokality, server odpovie inou rýchlosťou. Skúmaný čas odozvy má teda náhodný charakter. Interval spoľahlivosti vám teda umožňuje určiť hranice tohto parametra a potom bude možné tvrdiť, že s pravdepodobnosťou 95% bude server v rozsahu, ktorý sme vypočítali.

    Alebo potrebujete zistiť, koľko ľudí o tom vie ochranná známka firmy. Pri výpočte intervalu spoľahlivosti bude možné napríklad povedať, že s 95 % pravdepodobnosťou sa podiel spotrebiteľov, ktorí o tom vedia, pohybuje v rozmedzí od 27 % do 34 %.

    S týmto pojmom úzko súvisí taká hodnota ako úroveň spoľahlivosti. Predstavuje pravdepodobnosť, že požadovaný parameter je zahrnutý v intervale spoľahlivosti. Táto hodnota určuje, aký veľký bude náš požadovaný rozsah. Ako väčšiu hodnotu akceptuje, tým užší je interval spoľahlivosti a naopak. Zvyčajne je nastavená na 90 %, 95 % alebo 99 %. Najpopulárnejšia je hodnota 95 %.

    Zapnuté tento ukazovateľ vplyv má aj rozptyl pozorovaní a jeho definícia je založená na predpoklade, že skúmaný znak sa riadi.Toto tvrdenie je známe aj ako Gaussov zákon. Takéto rozdelenie všetkých pravdepodobností spojitej náhodnej veličiny, ktoré možno opísať hustotou pravdepodobnosti, sa podľa neho nazýva normálne. Ak sa predpoklad normálneho rozdelenia ukázal ako nesprávny, odhad sa môže ukázať ako nesprávny.

    Po prvé, poďme zistiť, ako vypočítať interval spoľahlivosti pre Tu sú možné dva prípady. Disperzia (stupeň šírenia náhodnej premennej) môže, ale nemusí byť známa. Ak je známy, potom sa náš interval spoľahlivosti vypočíta pomocou nasledujúceho vzorca:

    xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

    α - znak,

    t je parameter z Laplaceovej distribučnej tabuľky,

    σ je druhá odmocnina disperzie.

    Ak je rozptyl neznámy, možno ho vypočítať, ak poznáme všetky hodnoty požadovanej funkcie. Na tento účel sa používa nasledujúci vzorec:

    σ2 = х2ср - (хр)2, kde

    х2ср - priemerná hodnota druhých mocnín študovaného znaku,

    (xsr)2 je druhá mocnina tejto funkcie.

    Vzorec, podľa ktorého sa počíta interval spoľahlivosti, sa v tomto prípade mierne mení:

    xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

    xsr - vzorový priemer,

    α - znak,

    t je parameter, ktorý sa nachádza pomocou Študentovej distribučnej tabuľky t \u003d t (ɣ; n-1),

    sqrt(n) je druhá odmocnina z celkovej veľkosti vzorky,

    s je druhá odmocnina z rozptylu.

    Zvážte tento príklad. Predpokladajme, že na základe výsledkov 7 meraní bol študovaný znak určený na 30 a rozptyl vzorky rovný 36. Je potrebné nájsť s pravdepodobnosťou 99% interval spoľahlivosti, ktorý obsahuje skutočnú hodnotu meraný parameter.

    Najprv určme, čomu sa t rovná: t \u003d t (0,99; 7-1) \u003d 3,71. Pomocou vyššie uvedeného vzorca dostaneme:

    xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

    30 – 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

    21.587 <= α <= 38.413

    Interval spoľahlivosti pre rozptyl sa vypočíta tak v prípade známeho priemeru, ako aj vtedy, keď neexistujú údaje o matematickom očakávaní a je známa iba hodnota nezaujatého bodového odhadu rozptylu. Nebudeme tu uvádzať vzorce na jeho výpočet, pretože sú dosť zložité a v prípade potreby sa dajú vždy nájsť na internete.

    Upozorňujeme len, že je vhodné určiť interval spoľahlivosti pomocou programu Excel alebo sieťovej služby, ktorá sa tak nazýva.

    Páčil sa vám článok? Zdieľaj to