Statystyka – Porady | Analizy | Opracowania | Obliczenia | Pomoc statystyczna
Najważniejsze definicje statystyczne, napisane prostym, zrozumiałym językiem.
Opis idei testu statystycznego oraz najważniejsze testy stosowane w praktyce, przedstawione na przykładach.
Najczęściej stosowane w statystyce opisowej miary rozkładu cechu w populacji
Działalność naukowa, technologia oraz biznesowa związana jest z generowaniem ogromu danych.

Witamy w serwisie Statystyka od A do Z!

Statystyka od A do Z to internetowa baza wiedzy z zakresu statystyki, ekonometrii i data mining.

Jako portal o charakterze edukacyjno-naukowym popularyzuje teoretyczną i praktyczną wiedzę z ww. obszarów, stanowiąc wsparcie merytoryczne zarówno dla początkujących adeptów statystyki i analizy danych, jak i wszystkich tych, którzy chcieliby pogłębić już posiadane w tym zakresie kwalifikacje. Serwis przeznaczony jest dla pracowników naukowych, doktorantów i studentów, jak również - dla pasjonatów zagadnień statystycznych czy zainteresowanych problematyką statystyczną przedsiębiorców z różnych branż.

Zaprezentowane na łamach portalu techniki, algorytmy oraz metody są powszechnie stosowane w różnego rodzaju badaniach naukowych oraz komercyjnych, w tym m.in. badaniach klinicznych i obserwacyjnych, badaniach rynku i opinii, badaniach marketingowych, a także prognozowaniu i modelowaniu danych.

Kalkulator
wielkości próby

Teoria i przykłady
Teoria i przykłady
Teoria i przykłady

Teoria i przykłady

Badanie o charakterze częściowym to badanie statystyczne, w którym o rozkładach cech statystycznych dla całej populacji wnioskuje się w oparciu o rezultaty badań przeprowadzonych na pewnej podgrupie populacji generalnej (próbie). Metoda reprezentacyjna jest najbardziej prawidłową realizacją badania częściowego, w której próba dobierana jest w sposób losowy.

W celu pozyskania informacji o rozkładach cech statystycznych w populacji generalnej, wybiera się w sposób losowy grupę jednostek, czyli próbę, na niej zaś przeprowadza się badania mające na celu wyznaczenie analogicznych rozkładów. Otrzymane rezultaty służą do wnioskowania o całości populacji, przy czym wnioskowanie to jest obarczone błędem. Rachunek prawdopodobieństwa pozwala na oszacowanie wartości tego błędu.

Istotnym aspektem metody jest dobór próby. Ponieważ na jej podstawie wnioskujemy o całej populacji generalnej, chcemy, aby próba stanowiła dobrą (w sensie zachowania właściwości i prawidłowości) reprezentację całości. Najważniejszymi czynnikami, które mają wpływ na dokładność metody reprezentacyjnej są: struktura zbiorowości, wykorzystany schemat losowania oraz liczebność próby.

Istnieje możliwość wyznaczenia minimalnej liczebności próby w oparciu o określone parametry (m.in. dotyczące jakości wyników badania). Do tych parametrów należą:

Minimalną liczebność próby wyznacza się inaczej, w zależności od tego, czy mamy do czynienia z populacją skończoną, czy nieskończoną. Z populacją nieskończoną rzadko mamy do czynienia w praktyce. W niektórych sytuacjach wygodniej jednak traktować populację o skończonej liczbie jednostek jako populację nieskończoną (w szczególności kiedy liczebność populacji generalnej jest bardzo duża). Dla populacji skończonej wzór na minimalną liczebność próby ma następującą postać:

natomiast dla populacji nieskończonej:

gdzie:
P – szacowana wielkość frakcji,
z – wartość wynikająca z przyjętego poziomu istotności (α), obliczana przy pomocy dystrybuanty rozkładu normalnego,
N – liczebność populacji generalnej (w przypadku populacji skończonej),
e – maksymalny błąd oszacowania.

Jeżeli nie jesteśmy w stanie oszacować wielkości frakcji P, jej wartość powinna zostać ustawiona na 50% (domyślnie).

Ponieważ rozważamy liczebność populacji, otrzymany wynik powinien być liczbą naturalną. Dlatego też wartość będąca wynikiem obliczeń zaokrąglona jest w górę. Mamy wówczas pewność, że wyniki badania przeprowadzonego na próbie o liczności nie mniejszej niż minimalna liczebność próby będą spełniały założenia, które zostały nałożone poprzez zadane parametry (maksymalny błąd oszacowania i poziom istotności).

Kalkulator wielkości próby pozwala na wyznaczenie minimalnej liczebności próby, dzięki której uzyskamy wyniki badania z zadaną dokładnością. Kalkulator jest dostępny w dwóch wariantach: dla populacji skończonej i dla populacji nieskończonej.

Przykład:
Chcemy przeprowadzić kontrolę jakości partii liczącej 10000 konserw. Jedynym sposobem na wskazanie ze stuprocentową pewnością dokładnej liczby puszek, których zawartość jest niezdatna do spożycia, jest otwarcie każdej konserwy w partii. Jest to oczywiście rozwiązanie niedopuszczalne; dlatego chcemy otworzyć taką liczbę puszek, aby prawdopodobieństwo tego, że faktyczny odsetek uszkodzonych konserw w całej partii będzie się różnił od oszacowanego o więcej niż 4%, wynosiło 0,05. Równoważnie: chcemy mieć 95% pewności, że rzeczywisty odsetek uszkodzonych konserw nie różni się od oszacowanego na podstawie próby o więcej niż 4%.

Aby uzyskać wyniki z opisaną wyżej dokładnością powinniśmy otworzyć 566 puszek.

Określenie minimalnej liczebności próby dla średniej:

W podobny sposób możemy określać minimalną liczebność próby dla szacowania średniej. Liczebność próby zapewniającą uzyskanie ustalonej z góry dokładności estymacji przedziałowej średniej wyraża wielkość:

Należy jednak pamiętać, że stosowanie tego wzoru wymaga normalności rozkładu badanej zmiennej oraz stałej i znanej wariancji σ2.

Jeżeli populacja generalna ma rozkład normalny z nieznaną wariancją σ2, minimalną liczebność próby możemy wyznaczyć korzystając z tzw. dwustopniowej metody Steina. Liczebność próby określamy wtedy na podstawie wzoru:

Gdzie:
n0 – liczebność próby w badaniu pilotażowym,
S2 wariancja próby obliczona na podstawie badania pilotażowego,
tα,n-1 – wartość odczytana z tablic rozkładu t-Studenta dla n0-1 stopni swobody.

Przykład:

Niezbędna liczebność próby przy szacowaniu średniej w populacji może poinformować na przykład jak liczna powinna być próba, żeby móc na jej podstawie oszacować średnią wagę ogółu noworodków przy ustalonym poziomie istotności α=0.01 i maksymalnym błędzie szacunku 0.3kg, jeżeli jej rozkład jest normalny ze znaną wariancją 0.56.

W tym przypadku szukana liczba to 42, co oznacza, że próba musiałaby zostać przeprowadzona na co najmniej 42 noworodkach.

Aktualności

Statystyk - Praca

19 kwietnia 2018

Oferta pracy w dziale Statystyki firmy BioStat. Oferta praktyk adresowana jest do kreatywnych studentów a…

Zapraszamy do współpracy!

Uważasz, że Portal warto rozbudować o dodatkowe treści? Zajmujesz się szeroko pojętą statystyką? Przyślij do nas artykuł z zakresu statystyki, a my po pozytywnej recenzji opublikujemy go na stronie.

Wszelkie uwagi mile widzane:
statystyka@biostat.com.pl
©2013 Statystyka.az.pl
Wszystkie prawa zastrzeżone.
Kontakt