Hurtownie danych i data mining

Język wykładowy Polski
Semestr Letni
Status W ofercie
Opiekun Piotr Wnuk-Lipiński
Liczba godzin
Rodzaj I2.Z - zastosowania inf.
ECTS 6
Polecany dla I roku Nie
Egzamin Tak
Tagi PD (przetwarzanie danych)

Opis przedmiotu:

**UWAGA: Wykład prowadzony wsp olnie z dr. Leszkiem Grocholskim.** Hurtownie danych są technologią zyskującą coraz większe zainteresowanie ze względu na potrzebę gromadzenia nieustannie rosnącej ilości danych dostarczanych codziennie przez przemysł, handel, urzędy statystyczne czy administrację państwową. Oprocz samej możliwości gromadzenia coraz większych ilości danych, często liczonych już w terabajtach, wymaga się coraz bardziej efektywnych mechanizmow dostępu do zgromadzonych danych. Klasyczne bazy danych nie będące w stanie sprostać takim wyzwaniom ustępują pola nowoczesnym systemom hurtowni danych specjalizujacych się właśnie w gromadzeniu i przetwarzaniu olbrzymich ilości danych. Naturalnie, samo gromadzenie danych jest niewystarczające. Coraz częściej dostrzegalna jest rożnica między daną a informacją. Mimo dużej ilości zgromadzonych danych, często pojawiają się problemy z uzyskaniem konkretnych informacji w nich ukrytych. Rozwiązaniem są algorytmy i technologie eksploracji danych, oparte na algorytmach sztucznej inteligencji i metodach statystycznych. Wykład będzie dotyczyć hurtowni danych i popularnych mechanizmow eksploracji danych. Pierwsza część wykładu będzie poświęcona hurtowniom danych, ich charakterystyce i najpopularniejszym modelom. Druga część wykładu będzie dotyczyć eksploracji danych. Następnie zostaną przedstawione najpopularniejsze zagadnienia eksploracji danych. Na wykładzie będą też omowione narzędzia służące do eksploracji i wizualizacji danych, w tym narzędzia dostępne w systemach baz danych, zwłaszcza w systemach baz danych Oracle. Końcowa część wykładu poświęcona będzie zastosowaniom eksploracji danych, zwłaszcza zaawansowanym zagadnieniom takim jak analiza tekstow czy wyszukiwanie wzorcow. Wykład będzie stanowić rozszerzenie wykładu Hurtownie danych i Business Intelligence. **Program:** 1\. Wprowadzenie do hurtowni danych. Charakterystyka hurtowni danych. Model relacyjny. Model wielowymiarowy. 2\. Eksploracja danych: cele, techniki, zastosowania. 3\. Predictive Data Mining: algorytmy i modele. Classification, Regression, Attribute Importance. 4\. Descriptive Data Mining: algorytmy i modele. Clustering, Association Models, Feature Extraction. 5\. Popularne narzędzia do eksploracji i wizualizacji danych. 6\. Zaawansowane zagadnienia: Text Mining, Sequence Similarity Search and Alignment. **Wymagania:** Mile widziana, ale nie wymagana, znajomość hurtowni danych. Opis oraz organizacja zajęć znajduje się na stronie [ wykładu](http://www.ii.uni.wroc.pl/~lipinski/lectureHDiDM2016.html).