Sisällysluettelo:
Väestön arviointia varten tilastotieteilijät käyttävät satunnaisesti otettua edustajaa väestöstä. Jos esimerkiksi painat 50 satunnaisia amerikkalaisia naisia, voit arvioida kaikkien amerikkalaisten naisten painon niiden keskimääräisen painon perusteella. Näytteenottovirhe tapahtuu, kun näytteen tulokset poikkeavat todellisesta väestön arvosta. Toisin sanoen, jos 50 naista tuottavat keskimäärin 135 kiloa, kun todellinen keskiarvo oli 150 kiloa, näytteenottovirheesi on -15 (havaittu miinus todellinen), mikä tarkoittaa, että aliarvioitit todellisen arvon 15 pistettä. Koska todellinen arvo on harvoin tunnettu, tilastotieteilijät käyttävät muita arvioita, kuten standardivirheitä ja luottamusvälejä, näytteenottovirheen arvioimiseksi.
vaihe
Laske mittausprosentti. Esimerkiksi, jos haluat tietää, kuinka suuri osa opiskelijoista on tietyssä koulussa savukkeita, ota sitten satunnainen näyte (sanotaan n, näytteen koko on 30), pyydä heitä täyttämään anonyymi kysely ja laskemaan prosenttiosuus opiskelijat, jotka sanovat tupakoivan. Kuvittele, sanotaan, että kuusi opiskelijaa sanoi, että he savuttavat. Sitten prosenttiosuus, joka tupakoi = (tupakoi #) / (mitattujen opiskelijoiden kokonaismäärä) x 100% = 6/30 x 100% = 20%.
vaihe
Laske vakiovirhe. Koska emme tiedä tupakoivien opiskelijoiden todellista osuutta, voimme vain arvioida näytteenottovirheen laskemalla vakiovirheen. Tilastoissa käytämme osuutta, p, laskennan prosenttiosuuden sijaan, joten muutetaan 20% suhteessa. Jaat 20% 100%: lla, saat p = 0,20. Standardivirhe (SE) suurille näytekokoille = sqrt p x (1 - p) / n, jossa sqrt x tarkoittaa x: n neliöjuuren ottamista. Tässä esimerkissä saamme SE = sqrt 0,2 x (0,8) / 30 = sqrt 0,00533…? 0,073.
vaihe
Luo luottamusväli. Alaraja: arvioitu osuus - 1,96 x SE = 0,2 - 1,96 (0,073) = 0,0569 Yläraja: arvioitu osuus + 1,96 x SE = 0,2 + 1,96 (0,073) = 0,343 Sanoisin, että olemme 95% luottavaisia tupakoitsijoiden todellisesta osuudesta on 0,0569 - 0,343 tai prosentteina 5,69% tai 34,3% opiskelijoista. Tämä laaja leviäminen osoittaa melko suuren näytteenottovirheen mahdollisuuden.
vaihe
Mittaa kaikki laskemaan tarkka näytteenottovirhe. Tee kaikki koulun opiskelijat valmiiksi anonyymiin kyselyihin ja laskevat niiden opiskelijoiden prosenttiosuuden, jotka sanoivat tupakoivan. Sanotaan, että se oli 120: sta 800: sta opiskelijasta, jotka sanoivat, että he savustivat, sitten prosenttiosuutemme on 120/800 x 100% = 15%. Siksi "näytteenottovirhe" = (arvioitu) - (todellinen) = 20 - 15 = 5. Mitä lähempänä nollaa, sitä paremmin arvioimme ja mitä pienempi näytteenottovirhe on. Todellisessa tilanteessa et kuitenkaan todennäköisesti tunne todellista arvoa, ja sinun on luotettava SE: n ja tulkinnan luottamusväliin.