Statystyka – Porady | Analizy | Opracowania | Obliczenia | Pomoc statystyczna

W zależności od tego, czy zmienne na których dokonujemy analizy składowych głównych  są zmiennymi reprezentującymi porównywalne wielkości (np. dobowe wydobycie ton węgla różnych kopalni) tworzymy macierz kowariancji. Natomiast w przypadku  wartości zmiennych nieporównywalnych ze sobą (np. mające różne jednostki) tworzymy macierz korelacji. Następne kroki analizy składowych głównych są w zasadzie takie same niezależnie od tego czy wychodzimy od macierzy kowariancji, czy korelacji.

Macierz kowariancji lub korelacji  będziemy oznaczać jako macierz

Wartości własne

Wielomianem charakterystycznym macierzy kwadratowej nazywamy wyznacznik macierzy , gdzie jest macierzą jednostkową, a zmienną.

Wartościami własnymi macierzy nazywamy pierwiastki jej wielomianu charakterystycznego.

Wartość własna daje informacje o tym, jaka część całkowitej zmienności jest tłumaczona przez daną składową główną

Wektory własne

Aby otrzymać wektor własny macierzy odpowiadający wartości własnej tej macierzy, musimy rozwiązać równanie

.

Wszystkie wektory własne macierzy obliczamy poprzez rozwiązanie powyższego równania dla każdej wartości własnej tej macierzy.

Wektor własny odzwierciedla wpływ poszczególnych zmiennych pierwotnych na daną składową główną.

Składowe główne

Składowe główne to wektory, których współczynniki są wektorami własnymi odpowiadającymi poszczególnym wartościom własnym macierzy . Mają one więc następującą postać:

.

Współczynniki powyższych składowych zapisuje się w postaci tzw. macierzy współczynników składowych głównych, która ma postać

Jak widać, w powyższej macierzy współczynniki poszczególnych składowych głównych ustawione są w kolumnach.

Dokładniejszą interpretację składowych można uzyskać poprzez wyznaczenie tzw. macierzy ładunków czynnikowych (które są współczynnikami korelacji między -tą zmienną i -tą składową).

Ładunki czynnikowe, podobnie jak współczynniki zawarte w wektorze własnym, odzwierciedlają wpływ poszczególnych zmiennych na daną składową główną.

W przypadku, gdy macierz jest macierzą kowariancji ładunek czynnikowy jest równy ilorazowi wartości przez odchylenie standardowe.

Natomiast gdy macierz jest macierzą korelacji, to ładunek czynnikowy ma postać:

Poprzez podniesienie do kwadratu wartości ładunków czynnikowych uzyskujemy udział wyjaśnionej wariancji (współczynniki determinacji). Która oznacza ile procent wariancji i-tej zmiennej jest wyjaśniana przez j-tą składową główną. Dodatkowo sumę współczynników determinacji  w danym wierszu nazywamy zasobem zmienności i wynosi 100%.

Przykład

Dla danych  stanowiących losowo wybraną grupę osób pobrano pięć pomiarów w różnych jednostkach pomiarowych.Macierz korelacji dla danych wygląda następująco:

Aby obliczyć watości własne macierzy należy roziwązać równanie czyli:

 

co sprowadza się do odnalezienia współczynników wielomianu:

,

wynikiem tego działania są wartości własne macierzy:

Podstawiając wartości własne do wzoru obliczamy wektory własne macierzy:

,
,
,
,

Następnie wektory macierzy przemnożono przez odpowiednie współczynniki macierzy według wzoru:







uzyskując tabelę ładunków czynnikowych:

 

 

0,81

0,42

0,37

-0,17

0,01

0,94

0,04

-0,04

0,32

-0,08

0,92

0,03

-0,33

-0,20

0,05

0,11

-0,97

0,04

-0,20

-0,11

0,33

-0,92

0,11

0,14

0,12

 

Jeśli poszczególne ładunki czyynikowe podniesie się do kwadratu uzyska się współczynniki determinacji:






 

 

0,66

0,17

0,14

0,03

0,00

0,89

0,00

0,00

0,10

0,01

0,84

0,00

0,11

0,04

0,00

0,01

0,94

0,00

0,04

0,01

0,11

0,85

0,01

0,02

0,01

 

Wszelkie uwagi mile widzane:
statystyka@biostat.com.pl
©2013 Statystyka.az.pl
Wszystkie prawa zastrzeżone.
Kontakt