Seminarium: Text Mining

Język wykładowy	Polski
Semestr	Zimowy
Status	W ofercie
Opiekun	Paweł Rychlikowski
Liczba godzin	30 (sem.)
Rodzaj	Seminarium
ECTS	3
Polecany dla I roku	Nie
Egzamin	Nie
Tagi	PD (przetwarzanie danych)

Opis przedmiotu:

Seminarium dotyczy zagadnień Text Miningu, czyli różnych algorytmów próbujących wyciągnąć wartościowe informacje z dużych kolekcji tekstów napisanych w języku naturalnym (takim jak polski, czy angielski). Zajęcia będą kontynuacją pewnych wątków z wykładu o tym samym tytule, niemniej w zajęciach mogą uczestniczyć osoby, które na wykład TM nie chodziły. W takim przypadku mile widziani są absolwenci następujących kursów: Eksploracja danych, Przetwarzanie języka naturalnego lub Sieci neuronowe. Będziemy poruszać następujące zagadnienia: * Odkrywanie znaczenia słów i relacji pomiędzy słowami za pomocą analizy tekstów (ze szczególnym uwzględnieniem słów wieloznacznych) * Metody wizualizacji kolekcji dokumentów * Ekstrakcja użytecznych informacji z tekstów, * Tworzenie generatorów tekstów o zadanych właściwościach * Tworzenie agentów konwersacyjnych * Streszczanie dokumentów oraz grup dokumentów * Uczenie się optymalnego rankingu w wyszukiwaniu informacji * Różne zadania klasyfikacji tekstów i współczesne narzędzia umożliwiające tę klasyfikację * Inne zadania z dziedziny Natural Language Processing, które mogą korzystać z dużych kolekcji dokumentów. Każdy uczestnik seminarium wygłosi co najmniej jedno wystąpienie. Jeżeli nie zostanie w ten sposób wypełniony cały semestr, wówczas (w zależności od woli uczestników) odbędzie się druga tura wystąpień, albo będą realizowane (grupowe) miniprojekty, związane z tematyką seminarium.