Analiza danych i wariancji

Język wykładowy Polski
Semestr Letni
Status Wycofana z oferty
Opiekun Witold Karczewski
Liczba godzin 30 (wyk.) 30 (ćw.)
Rodzaj I2.Z - zastosowania inf.
ECTS 6
Polecany dla I roku Nie
Egzamin Tak
Tagi PD (przetwarzanie danych)

Opis przedmiotu:

Wielowymiarowa analiza danych. 1. Tworzenie macierzy wariancji-kowariancji dla zbioru danych. 2. PCA -- metoda kierunków głównych. Rzutowanie zbioru obserwacji na podprzestrzeń o mniejszej liczbe wymiarów tak aby zachować jak najwięcej wariancji. W praktyce polega to na obliczeniu wektorów własnych odpowiadających największym wartościom własnym macierzy wariancji-kowariancji. 3. Opisanie zmiennych i osobników w terminach kierunków głównych. Które zmienne i w jakim stopniu składają się na kierunki główne? Które osobniki i w jakim stopniu składają się na kierunki główne? 4. CA -- analiza odpowiedniości. Zadanie podobne do PCA, ale dotyczące zmiennych jakościowych. Wartością zmiennej nie są tutaj liczby lecz kategorie (na przykład odpowiedź na pytanie z odpowiedzią A, B lub C). 5. Tworzenie średniego profilu wiersza i średniego profilu kolumny. Wskazanie na pewną miarę odległości, która wiąże odpowiedzi z testem niezależności chi-kwadrat. Pozostała część bardzo podobna do metody PCA. 6. MCA -- wielowymiarowa analiza odpowiedniości. Jest to dla przykładu analizowanie wyników ankiet z wieloma pytaniami w formie wyboru z listy. 7. HCPC -- hierarchizacja osobników na podstawie analizy PCA/MCA. Tworzenie drzewa ilustrującego podział wyjściowego zbioru na kilka grup. Literatura: * Husson, Le, Pages -- Exploratory Multivariate Analysis by Example Using R * Greenacre -- Theory and Applications of Correspondence Analysis. * Mirkin -- Clustering for Data Mining: A Data Recovery Approach.