Seminarium dotyczy zagadnień Text Miningu, czyli różnych algorytmów
próbujących wyciągnąć wartościowe informacje z dużych kolekcji tekstów
napisanych w języku naturalnym (takim jak polski, czy angielski). Zajęcia będą
kontynuacją pewnych wątków z wykładu o tym samym tytule, niemniej w zajęciach
mogą uczestniczyć osoby, które na wykład TM nie chodziły. W takim przypadku
mile widziani są absolwenci następujących kursów: Eksploracja danych,
Przetwarzanie języka naturalnego lub Sieci neuronowe. Będziemy poruszać
następujące zagadnienia:
* Odkrywanie znaczenia słów i relacji pomiędzy słowami za pomocą analizy tekstów (ze szczególnym uwzględnieniem słów wieloznacznych)
* Metody wizualizacji kolekcji dokumentów
* Ekstrakcja użytecznych informacji z tekstów,
* Tworzenie generatorów tekstów o zadanych właściwościach
* Tworzenie agentów konwersacyjnych
* Streszczanie dokumentów oraz grup dokumentów
* Uczenie się optymalnego rankingu w wyszukiwaniu informacji
* Różne zadania klasyfikacji tekstów i współczesne narzędzia umożliwiające tę klasyfikację
* Inne zadania z dziedziny Natural Language Processing, które mogą korzystać z dużych kolekcji dokumentów.
Każdy uczestnik seminarium wygłosi co najmniej jedno wystąpienie. Jeżeli nie
zostanie w ten sposób wypełniony cały semestr, wówczas (w zależności od woli
uczestników) odbędzie się druga tura wystąpień, albo będą realizowane
(grupowe) miniprojekty, związane z tematyką seminarium.