Seminarium dotyczy zagadnień Text Miningu, czyli różnych algorytmów
próbujących wyciągnąć wartościowe informacje z dużych kolekcji tekstów
napisanych w języku naturalnym (takim jak polski, czy angielski). Zajęcia będą
kontynuacją pewnych wątków z wykładu o tym samym tytule, niemniej w zajęciach
mogą uczestniczyć osoby, które na wykład TM nie chodziły. W takim przypadku
mile widziani są absolwenci następujących kursów: Eksploracja danych,
Przetwarzanie języka naturalnego lub Sieci neuronowe. Będziemy poruszać
następujące zagadnienia:
* Odkrywanie znaczenia słów i relacji pomiędzy słowami za pomocą analizy tekstów (ze szczególnym uwzględnieniem słów wieloznacznych)
* Metody wizualizacji kolekcji dokumentów
* Ekstrakcja użytecznych informacji z tekstów,
* Tworzenie generatorów tekstów o zadanych właściwościach
* Tworzenie agentów konwersacyjnych
* Streszczanie dokumentów oraz grup dokumentów
* Uczenie się optymalnego rankingu w wyszukiwaniu informacji
* Różne zadania klasyfikacji tekstów i współczesne narzędzia umożliwiające tę klasyfikację
* Inne zadania z dziedziny Natural Language Processing, które mogą korzystać z dużych kolekcji dokumentów.
Każdy uczestnik seminarium wygłosi co najmniej jedno wystąpienie. Jeżeli nie
zostanie w ten sposób wypełniony cały semestr, wówczas (w zależności od woli
uczestników) odbędzie się druga tura wystąpień, albo będą realizowane
(grupowe) miniprojekty, związane z tematyką seminarium.
Konsultacje w semestrze *zimowym* roku akademickiego 2025/2026 będą we wtorki w godzinach 11-12 oraz 14-15. Można też umawiać się na konsultacje w innych terminach (w szczególności, jeżeli nie ma Rady Wydziału, to o 12 jestem też dostępny)
*Uwaga*: konsultacje 28.10 nie odbędą się. Osoby zainteresowane proszę o kontakt mailowy, znajdziemy inny termin.