Tagi
systemy sieciowe i komputerowe algorytmika i złożoność obliczeniowa metody numeryczne i grafika komputerowa języki programowania i logika przetwarzanie danych Data Science Praca zespołowa Bazy danych Ekonomia Inżynieria oprogramowania Projektowanie i programowanie obiektowe Architektury systemów komputerowych Systemy operacyjne Sieci komputerowe Ochrona własności intelektualnej Rachunek prawdopodobieństwa i statystykaEfekty kształcenia
Podstawy informatyki i programowania Programowanie i projektowanie obiektowe Architektury systemów komputerowych Rachunek prawdopodobieństwa (L) Systemy operacyjne Sieci komputerowe Bazy danych Podstawy inżynierii oprogramowania Inżynieria oprogramowania (L) Rachunek prawdopodobieństwa (I) Społeczno-ekonomiczne aspekty informatyki (I)Analiza danych i wariancji
Język wykładowy | Polski |
---|---|
Semestr | Letni |
Status | Wycofana z oferty |
Opiekun | Witold Karczewski |
Liczba godzin | 30 (wyk.) 30 (ćw.) |
Rodzaj | I2.Z - zastosowania inf. |
ECTS | 6 |
Polecany dla I roku | Nie |
Egzamin | Tak |
Tagi | PD (przetwarzanie danych) |
Opis przedmiotu:
Wielowymiarowa analiza danych.
- Tworzenie macierzy wariancji-kowariancji dla zbioru danych.
- PCA – metoda kierunków głównych. Rzutowanie zbioru obserwacji na podprzestrzeń o mniejszej liczbe wymiarów tak aby zachować jak najwięcej wariancji. W praktyce polega to na obliczeniu wektorów własnych odpowiadających największym wartościom własnym macierzy wariancji-kowariancji.
- Opisanie zmiennych i osobników w terminach kierunków głównych. Które zmienne i w jakim stopniu składają się na kierunki główne? Które osobniki i w jakim stopniu składają się na kierunki główne?
- CA – analiza odpowiedniości. Zadanie podobne do PCA, ale dotyczące zmiennych jakościowych. Wartością zmiennej nie są tutaj liczby lecz kategorie (na przykład odpowiedź na pytanie z odpowiedzią A, B lub C).
- Tworzenie średniego profilu wiersza i średniego profilu kolumny. Wskazanie na pewną miarę odległości, która wiąże odpowiedzi z testem niezależności chi-kwadrat. Pozostała część bardzo podobna do metody PCA.
- MCA – wielowymiarowa analiza odpowiedniości. Jest to dla przykładu analizowanie wyników ankiet z wieloma pytaniami w formie wyboru z listy.
- HCPC – hierarchizacja osobników na podstawie analizy PCA/MCA. Tworzenie drzewa ilustrującego podział wyjściowego zbioru na kilka grup.
Literatura:
- Husson, Le, Pages – Exploratory Multivariate Analysis by Example Using R
- Greenacre – Theory and Applications of Correspondence Analysis.
- Mirkin – Clustering for Data Mining: A Data Recovery Approach.