Zadanie 1.

Zbadano grupę 30 studentów studiów niestacjonarnych pod względem wzrostu i otrzymano następujące rezultaty (wzrost w cm):

160, 165, 171, 173, 171,

171, 175, 180, 171, 167,

171, 165, 167, 171, 171,

175, 180, 171, 171, 167,

171, 171, 175, 178, 180,

167, 180, 167, 178, 180.

  1. Określ rodzaj cechy statystycznej.
  2. Przedstaw otrzymane wyniki w postaci szeregu szczegółowego, rozdzielczego punktowego, rozdzielczego z klasami przedziałowymi, kumulacyjnego punktowego i kumulacyjnego z klasami przedziałowymi.
  3. Oblicz wskaźniki struktury, skumulowane wskaźniki struktury oraz wyznacz dystrybuantę empiryczną dla szeregu rozdzielczego punktowego oraz z klasami przedziałowymi oraz zinterpretuj je.
  4. Oblicz średnią arytmetyczną dla szeregu szczegółowego, rozdzielczego punktowego oraz rozdzielczego z klasami przedziałowymi.
  5. Wskaż modalną dla szeregu szczegółowego i rozdzielczego punktowego oraz oblicz dla szeregu rozdzielczego z klasami przedziałowymi.
  6. Oblicz kwartyl drugi dla szeregu szczegółowego, rozdzielczego punktowego oraz rozdzielczego z klasami przedziałowymi.
  7. Oblicz odchylenie przeciętne, wariancję oraz odchylenie standardowe dla szeregu szczegółowego, rozdzielczego punktowego oraz rozdzielczego z klasami przedziałowymi. Wyznacz typowy obszar zmienności

Rozwiązanie

Ad. 1.

Mamy tu do czynienia z cechą mierzalną, skokową.

Ad. 2.

Próba jest 30-elementowa, tj. n=30. Szereg szczegółowy to uporządkowany ciąg wartości. Uporządkujmy otrzymane wielkości rosnąco. W ten sposób otrzymujemy następujący szereg szczegółowy:

160, 165, 165, 167, 167, 167, 167, 167, 171, 171, 171, 171, 171, 171, 171, 171, 171, 171, 171, 173, 175, 175, 175, 178, 178, 180, 180, 180, 180, 180.

Szereg rozdzielczy punktowy budujemy w ten sposób, że każdej przyjętej przez cechę wartości przyporządkowujemy liczebność. W naszym szeregu mamy 8 wariantów cechy: 160, 165, 167, 171, 173, 175, 178, 180. Każdemu z nich przyporządkowujemy liczbę wystąpienia jego wartości w szeregu, np. wartość 160 wystąpiła 1 raz, wartość 165 otrzymano 2 razy, wartość 167 wystąpiła 5 razy itd. W ten sposób stosując wcześniej wprowadzone oznaczenia otrzymujemy szereg rozdzielczy punktowy:

Przedstawienie rezultatów w postaci szeregu rozdzielczego z klasami przedziałowymi.
W tym celu ustalamy:

  1. Liczbę klas:

    Ponieważ liczba klas musi być liczbą naturalną, ustalamy, że będzie ich 5.

  2. Rozpiętość przedziałów klasowych
  3. Granice poszczególnych klas: dolną granicą pierwszej klasy będzie wartość 160 jako najmniejsza wartość otrzymana w wyniku obserwacji. Górną granicę tej klasy wyliczymy dodając do granicy dolnej rozpiętość klas czyli 160+4=164. Dolną granicą kolejnej klasy będzie wartość 164, ale wartość tę będziemy zaliczać do klasy pierwszej, więc ponieważ mamy tu do czynienia z cechą skokową możemy zapisać, że jest to wartość 165, ale górną granicą będzie wartość 164+4=168. Postępując w ten sposób otrzymamy poszczególne granice każdej z klas, przyporządkowując im liczebność otrzymamy następujący szereg rozdzielczy z klasami przedziałowymi:

Szeregi kumulacyjne.

Ad. 3.

Częstość, częstość skumulowana oraz dystrybuanta empiryczna dla szeregu kumulacyjnego punktowego:

Dla pierwszego rodzaju szeregu kolejne charakterystyki np. dla wartości 171 zinterpretujemy następująco:

  • liczebność równa 11 oznacza, że 11 osób spośród przebadanych miało wzrost równy 171 cm;
  • liczebność skumulowana równa 19 oznacza, że 19 osób spośród przebadanych miało wzrost nie większy niż 171 cm;
  • wskaźnik struktury równy 0,366 oznacza, że 36,6% badanych osób miało wzrost równy 171 cm;
  • skumulowany wskaźnik struktury równy 0,633 oznacza, że 63,3% badanych osób miało wzrost nie mniejszy niż 171 cm.

Częstość, częstość skumulowana oraz dystrybuanta empiryczna dla szeregu kumulacyjnego z klasami przedziałowymi:

Dla szeregu rozdzielczego z klasami przedziałowymi np. dla klasy trzeciej 168-172 interpretacja będzie następująca:

  • liczebność równa 11 oznacza, że 11 osób spośród przebadanych miało wzrost pomiędzy 168 cm a 172 cm;
  • liczebność skumulowana równa 19 oznacza, że 19 osób spośród przebadanych miało wzrost nie większy niż 172 cm;
  • wskaźnik struktury równy 0,366 oznacza, że 36,6% badanych osób miało wzrost z przedziału 168 - 172 cm;
  • skumulowany wskaźnik struktury równy 0,633 oznacza, że 63,3% badanych osób miało wzrost nie mniejszy niż 172 cm.

Ad. 4.

Średnią arytmetyczną dla różnych szeregów policzymy w następujący sposób:

  • dla szeregu szczegółowego sumujemy wszystkie wartości i dzielimy otrzymaną sumę przez liczebność próby. W ten sposób otrzymujemy:
  • dla szeregu rozdzielczego punktowego różnić się będzie tylko tym, że np. zamiast pisać 160+165+165 napiszemy 160+2∙165. W ten sposób otrzymujemy:
  • dla szeregu rozdzielczego z klasami przedziałowymi należy najpierw ustalić środki przedziałów klasowych. W ten sposób otrzymujemy:

Stąd średnia arytmetyczna jest równa:

Różnica pomiędzy tą wielkością a poprzednio wyliczonymi średnimi wynika z tego, że zamiast dokładnych wartości cechy przybliżaliśmy je za pomocą środków klas przedziałowych. Otrzymana średnia jest tylko przybliżeniem średniej arytmetycznej.

Wielkość średniej arytmetycznej zinterpretujemy jako: przeciętny wzrost w grupie badanych studentów wynosi 172 cm (171,2 cm).

Ad. 5.

Modalną możemy wskazać dla szeregu szczegółowego i rozdzielczego punktowego wiedząc ile razy wystąpiły w szeregu poszczególne wartości cechy. W obu przypadkach będzie to wielkość 171 cm gdyż wystąpiła ona aż 11 razy.

Dla szeregu rozdzielczego z klasami przedziałowymi należy ustalić przedział, w którym występuje modalna, czyli przedział o największej liczebności. Będzie to przedział 169-172. Dolna granica tego przedziału to xom=169, liczebność wynosi 11, rozpiętość klasy jest równa 4.

Podstawiając do wzoru otrzymujemy:

Podobnie jak w przypadku średniej arytmetycznej, ponieważ stosujemy jedynie wzór przybliżający daną wielkość, modalna wyliczona dla szeregu rozdzielczego z klasami przedziałowymi co do wartości różni się od modalnej dla tego samego szeregu zapisanego jako szczegółowy lub rozdzielczy punktowy.

Ad. 6.

Ponieważ mamy 30 obserwacji, czyli n jest parzyste, to mediana będzie równa średniej arytmetycznej z wartości cechy które wystąpiły jak obserwacja 15 i 16 w szeregu. Stąd:

Dla szeregu rozdzielczego z klasami przedziałowymi musimy wyznaczyć numer mediany i dzięki niemu ustalić przedział, w którym znajduje się mediana.

Przedział zawierający obserwację o numerze 15 to przedział 169-172. Mając tę informację możemy podstawić poszczególne wielkości do wzoru otrzymując w ten sposób:

Interpretacja: Połowa przebadanych studentów mierzyła mniej lub równo 171 (171,54) cm, a połowa z nich więcej niż 171 (171,54) cm.

Ad. 7.

Odchylenie przeciętne dla szeregu szczegółowego, ponieważ średnia arytmetyczna była równa 172 cm, otrzymujemy:

Przeciętne odchylenie wzrostu studentów wynosi 4,13 cm.

Odchylenie przeciętne dla szeregu rozdzielczego punktowego:

Przeciętne odchylenie wzrostu studentów wynosi 4,13 cm.

Odchylenie przeciętne dla szeregu rozdzielczego z klasami przedziałowymi:

Przeciętne odchylenie wzrostu studentów wynosi 3,92 cm.

Wariancja dla szeregu szczegółowego, ponieważ średnia arytmetyczna była równa 172 cm, otrzymujemy:

Wariancja dla szeregu rozdzielczego punktowego:

Wariancja dla szeregu rozdzielczego z klasami przedziałowymi
Najwygodniej będzie wykorzystać dane z tabeli:



Odchylenie standardowe dla szeregu szczegółowego i rozdzielczego punktowego:

Odchylenie standardowe dla szeregu rozdzielczego z klasami przedziałowymi:

Interpretacja tego parametru jest następująca: przeciętne zróżnicowanie wzrostu studentów (średnia różnica poszczególnych wartości od średniej arytmetycznej) w badanej populacji wynosi 5,16 cm (4,64 cm).

Typowy obszar zmienności wynosi

dla przypadku, gdy obserwacje zapiszemy w postaci szeregu rozdzielczego z klasami przedziałowymi