Analiza danych i wariancji

Język wykładowy Polski
Semestr Letni
Status Wycofana z oferty
Opiekun Witold Karczewski
Liczba godzin 30 (wyk.) 30 (ćw.)
Rodzaj I2.Z - zastosowania inf.
ECTS 6
Polecany dla I roku Nie
Egzamin Tak
Tagi PD (przetwarzanie danych)

Opis przedmiotu:

Wielowymiarowa analiza danych.

  1. Tworzenie macierzy wariancji-kowariancji dla zbioru danych.
  2. PCA – metoda kierunków głównych. Rzutowanie zbioru obserwacji na podprzestrzeń o mniejszej liczbe wymiarów tak aby zachować jak najwięcej wariancji. W praktyce polega to na obliczeniu wektorów własnych odpowiadających największym wartościom własnym macierzy wariancji-kowariancji.
  3. Opisanie zmiennych i osobników w terminach kierunków głównych. Które zmienne i w jakim stopniu składają się na kierunki główne? Które osobniki i w jakim stopniu składają się na kierunki główne?
  4. CA – analiza odpowiedniości. Zadanie podobne do PCA, ale dotyczące zmiennych jakościowych. Wartością zmiennej nie są tutaj liczby lecz kategorie (na przykład odpowiedź na pytanie z odpowiedzią A, B lub C).
  5. Tworzenie średniego profilu wiersza i średniego profilu kolumny. Wskazanie na pewną miarę odległości, która wiąże odpowiedzi z testem niezależności chi-kwadrat. Pozostała część bardzo podobna do metody PCA.
  6. MCA – wielowymiarowa analiza odpowiedniości. Jest to dla przykładu analizowanie wyników ankiet z wieloma pytaniami w formie wyboru z listy.
  7. HCPC – hierarchizacja osobników na podstawie analizy PCA/MCA. Tworzenie drzewa ilustrującego podział wyjściowego zbioru na kilka grup.

Literatura:

  • Husson, Le, Pages – Exploratory Multivariate Analysis by Example Using R
  • Greenacre – Theory and Applications of Correspondence Analysis.
  • Mirkin – Clustering for Data Mining: A Data Recovery Approach.