Eksploracja tekstów lato 2016/17

Lista

Język wykładowy	Polski
Opiekun	Paweł Rychlikowski
Liczba godzin	30 (wyk.) 30 (ćw-prac.)
Rodzaj	I2.Z - zastosowania inf.
ECTS	6
Polecany dla I roku	Nie
Egzamin	Tak
Tagi	PD (przetwarzanie danych)

Opis przedmiotu:

Text mining jest dziedziną, w ktorej zajmujemy się eksploracją tekstow napisanych w języku naturalnym (takim jak polski, czy angielski). Znajduje się ona na przecięciu wyszukiwania informacji, eksploracji danych oraz przetwarzania języka naturalnego. Z racji tego, że coraz więcej danych jest dostępnych w takiej postaci, text mining ma coraz większe znaczenie. Na wykładzie szczegolny nacisk będzie położony na praktyczne aspekty tej dziedziny, co między innymi oznacza, że będziemy zajmować się zadaniami związanymi z konkretnymi kolekcjami dokumentow (o rozmiarze rzędu miliona dokumentow). W szczegolności będziemy tworzyć system odpowiadający na pytania w języku naturalnym (bazujący na polskiej Wikipedii), system klasyfikacji krotkich wiadomości prasowych (bazujący na Wikinews), system znajdujący dokumenty podobne do wskazanego, system streszczania dokumentow (zarowno pojedynczych, jak i grup dokumentow). Zajmiemy się rownież zadaniem klasyfikacji (na przykładzie orzeczeń sądowych). Na wykładzie zostaną rownież omowione pewne wspołczesne mechanizmy związane ze znajdywaniem reprezentacji wektorowej słow wywodzące się z sieci neuronowych (m.in. word2vec oraz GloVe) i praktyczne konsekwencje użycia tych reprezentacji w rożnych zadaniach TextMiningu. Będą rownież omowione metody wizualizacji tekstow i słow. Pierwszą część wykładu poświęcimy na opracowanie pewnych narzędzi, ktore umożliwią realizację wymienionych wyżej zadań, w szczegolności zajmiemy się metodami automatycznego odkrywania gramatyki danego języka oraz znaczenia słow (jak rownież relacji pomiędzy słowami). Wykładowi będą towarzyszyły ćwiczenia połączone z pracownią. Od uczestnika wymagana jest umiejętność programowania, najlepiej w języku wysokiego poziomu.

Wykłady

Lista

Prowadzący	Termin zajęć	Limit	Zapisani	Kolejka
Paweł Rychlikowski	śr 12:00-14:00 (s. 25)	300	22	0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.

Ćwiczenio-pracownie

Lista

Prowadzący	Termin zajęć	Limit	Zapisani	Kolejka
Paweł Rychlikowski	wt 08:00-10:00 (s. 104, 110)	18	11	0
Paweł Rychlikowski	wt 10:00-12:00 (s. 104, 110)	18	11	0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.

Konsultacje prowadzących:

Imię i nazwisko	Pokój	Konsultacje
Paweł Rychlikowski	302	Konsultacje w semestrze zimowym roku akademickiego 2025/2026 będą we wtorki w godzinach 11-12 oraz 14-15. Można też umawiać się na konsultacje w innych terminach (w szczególności, jeżeli nie ma Rady Wydziału, to o 12 jestem też dostępny) Uwaga: konsultacje 28.10 nie odbędą się. Osoby zainteresowane proszę o kontakt mailowy, znajdziemy inny termin.