Hurtownie danych i data mining lato 2015/16

Język wykładowy Polski
Opiekun Piotr Wnuk-Lipiński
Liczba godzin
Rodzaj I2.Z - zastosowania inf.
ECTS 6
Polecany dla I roku Nie
Egzamin Tak
Tagi PD (przetwarzanie danych)

Opis przedmiotu:

**UWAGA: Wykład prowadzony wsp olnie z dr. Leszkiem Grocholskim.** Hurtownie danych są technologią zyskującą coraz większe zainteresowanie ze względu na potrzebę gromadzenia nieustannie rosnącej ilości danych dostarczanych codziennie przez przemysł, handel, urzędy statystyczne czy administrację państwową. Oprocz samej możliwości gromadzenia coraz większych ilości danych, często liczonych już w terabajtach, wymaga się coraz bardziej efektywnych mechanizmow dostępu do zgromadzonych danych. Klasyczne bazy danych nie będące w stanie sprostać takim wyzwaniom ustępują pola nowoczesnym systemom hurtowni danych specjalizujacych się właśnie w gromadzeniu i przetwarzaniu olbrzymich ilości danych. Naturalnie, samo gromadzenie danych jest niewystarczające. Coraz częściej dostrzegalna jest rożnica między daną a informacją. Mimo dużej ilości zgromadzonych danych, często pojawiają się problemy z uzyskaniem konkretnych informacji w nich ukrytych. Rozwiązaniem są algorytmy i technologie eksploracji danych, oparte na algorytmach sztucznej inteligencji i metodach statystycznych. Wykład będzie dotyczyć hurtowni danych i popularnych mechanizmow eksploracji danych. Pierwsza część wykładu będzie poświęcona hurtowniom danych, ich charakterystyce i najpopularniejszym modelom. Druga część wykładu będzie dotyczyć eksploracji danych. Następnie zostaną przedstawione najpopularniejsze zagadnienia eksploracji danych. Na wykładzie będą też omowione narzędzia służące do eksploracji i wizualizacji danych, w tym narzędzia dostępne w systemach baz danych, zwłaszcza w systemach baz danych Oracle. Końcowa część wykładu poświęcona będzie zastosowaniom eksploracji danych, zwłaszcza zaawansowanym zagadnieniom takim jak analiza tekstow czy wyszukiwanie wzorcow. Wykład będzie stanowić rozszerzenie wykładu Hurtownie danych i Business Intelligence. **Program:** 1\. Wprowadzenie do hurtowni danych. Charakterystyka hurtowni danych. Model relacyjny. Model wielowymiarowy. 2\. Eksploracja danych: cele, techniki, zastosowania. 3\. Predictive Data Mining: algorytmy i modele. Classification, Regression, Attribute Importance. 4\. Descriptive Data Mining: algorytmy i modele. Clustering, Association Models, Feature Extraction. 5\. Popularne narzędzia do eksploracji i wizualizacji danych. 6\. Zaawansowane zagadnienia: Text Mining, Sequence Similarity Search and Alignment. **Wymagania:** Mile widziana, ale nie wymagana, znajomość hurtowni danych. Opis oraz organizacja zajęć znajduje się na stronie [ wykładu](http://www.ii.uni.wroc.pl/~lipinski/lectureHDiDM2016.html).

Wykłady

Lista
Prowadzący Termin zajęć Limit Zapisani Kolejka
Leszek Grocholski
śr 10:00-12:00 (s. 119) 0 14 0
Piotr Wnuk-Lipiński
śr 10:00-12:00 (s. 119) 300 14 0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.

Ćwiczenio-pracownie

Lista
Prowadzący Termin zajęć Limit Zapisani Kolejka
Leszek Grocholski
wt 16:00-18:00 (s. 5, 110) 18 6 0
Leszek Grocholski
śr 12:00-14:00 (s. 5, 110) 0 0 0
Piotr Wnuk-Lipiński
wt 16:00-18:00 (s. 5, 110) 0 0 0
Piotr Wnuk-Lipiński
śr 12:00-14:00 (s. 5, 110) 18 8 0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.


Konsultacje prowadzących:


Imię i nazwisko Pokój Konsultacje
Piotr Wnuk-Lipiński 203 środa 14.00 - 15.00, czwartek 13.00 - 14.00, piątek 12.00 - 14.00, możliwe też inne terminy, konsultacje online (domyślnie) lub offline (po ustaleniu emailem), proszę o wcześniejszy kontakt emailem lub zarezerwowanie terminu przez kalendarz Google
Leszek Grocholski 236 Po wcześniejszym umówieniu się pocztą elektroniczną