**UWAGA: Wykład prowadzony wsp olnie z dr. Leszkiem Grocholskim.**
Hurtownie danych są technologią zyskującą coraz większe zainteresowanie ze
względu na potrzebę gromadzenia nieustannie rosnącej ilości danych
dostarczanych codziennie przez przemysł, handel, urzędy statystyczne czy
administrację państwową. Oprocz samej możliwości gromadzenia coraz większych
ilości danych, często liczonych już w terabajtach, wymaga się coraz bardziej
efektywnych mechanizmow dostępu do zgromadzonych danych. Klasyczne bazy danych
nie będące w stanie sprostać takim wyzwaniom ustępują pola nowoczesnym
systemom hurtowni danych specjalizujacych się właśnie w gromadzeniu i
przetwarzaniu olbrzymich ilości danych.
Naturalnie, samo gromadzenie danych jest niewystarczające. Coraz częściej
dostrzegalna jest rożnica między daną a informacją. Mimo dużej ilości
zgromadzonych danych, często pojawiają się problemy z uzyskaniem konkretnych
informacji w nich ukrytych. Rozwiązaniem są algorytmy i technologie
eksploracji danych, oparte na algorytmach sztucznej inteligencji i metodach
statystycznych.
Wykład będzie dotyczyć hurtowni danych i popularnych mechanizmow eksploracji
danych. Pierwsza część wykładu będzie poświęcona hurtowniom danych, ich
charakterystyce i najpopularniejszym modelom. Druga część wykładu będzie
dotyczyć eksploracji danych. Następnie zostaną przedstawione najpopularniejsze
zagadnienia eksploracji danych. Na wykładzie będą też omowione narzędzia
służące do eksploracji i wizualizacji danych, w tym narzędzia dostępne w
systemach baz danych, zwłaszcza w systemach baz danych Oracle. Końcowa część
wykładu poświęcona będzie zastosowaniom eksploracji danych, zwłaszcza
zaawansowanym zagadnieniom takim jak analiza tekstow czy wyszukiwanie wzorcow.
Wykład będzie stanowić rozszerzenie wykładu Hurtownie danych i Business
Intelligence.
**Program:**
1\. Wprowadzenie do hurtowni danych. Charakterystyka hurtowni danych. Model
relacyjny. Model wielowymiarowy.
2\. Eksploracja danych: cele, techniki, zastosowania.
3\. Predictive Data Mining: algorytmy i modele. Classification, Regression,
Attribute Importance.
4\. Descriptive Data Mining: algorytmy i modele. Clustering, Association
Models, Feature Extraction.
5\. Popularne narzędzia do eksploracji i wizualizacji danych.
6\. Zaawansowane zagadnienia: Text Mining, Sequence Similarity Search and
Alignment.
**Wymagania:** Mile widziana, ale nie wymagana, znajomość hurtowni danych.
Opis oraz organizacja zajęć znajduje się na stronie [
wykładu](http://www.ii.uni.wroc.pl/~lipinski/lectureHDiDM2016.html).