Przetwarzanie języka naturalnego zima 2015/16

Język wykładowy Polski
Opiekun Paweł Rychlikowski
Liczba godzin 30 (wyk.) 15 (prac.) 15 (ćw-prac.)
Rodzaj I2.Z - zastosowania inf.
ECTS 6
Polecany dla I roku Nie
Egzamin Tak
Tagi PD (przetwarzanie danych)

Opis przedmiotu:

Celem wykładu byłoby omowienie metod stosowanych w analizie i przetwarzaniu tekstow w językow naturalnych, ze szczegolnym uwzględnieniem wynikow, ktore można przełożyć na efektywnie działające implementacje. Największy nacisk położony będzie na technologie pasujące do języka polskiego. Będziemy zajmowali się takimi zadaniami, jak: * tworzeniem rożnych modeli języka oraz stosowaniem ich do korekty błędow, rozpoznawania mowy czy też pisma * znajdowaniem struktury wypowiedzi * metodami ujednoznaczniania wypowiedzi, ktora może być odczytana na wiele sposobow (przykładowo w zdaniu: Janek je słonecznik i śmieci) * automatyczną analizą treści dokumentu, automatycznym określaniem tematyki dokumentu, czy * algorytmami streszczania * automatyczną generacją tekstu o określonych właściwościach * wyciąganiem użytecznej wiedzy z analizy bardzo dużych kolekcji tekstow Omowione zostaną między innymi następujące zagadnienia: łańcuchy Markowa, rożne formalizmy opisu języka (np. gramatyki atrybutowe, probabilistyczne gramatyki bezkonteksowe, HPSG, Tree Adjoining Grammar), traktowanie dokumentu jako multizbioru słow, rożne algorytmy parsingu tekstow, parsing powierzchniowy oraz analiza zależności. Ponadto będziemy zajmować się wspołczesnymi metodami wykorzystującymi sieci neuronowe. Przedstawiona też zostanie potrzebna wiedza lingwistyczna, oczywiście z perspektywy informatyka. Zajęciami dodatkowymi, wspomagającymi zrozumienie materiału i odnoszącymi omawiane zagadnienia do sfery praktycznej, byłyby ćwiczenia połączone z pracownią. Od studenta oczekujemy zaliczenie Metod programowania, umiejętności programowania w języku wyższego rzędu. Mile widziana jest podstawowa znajomość Prologa (na poziomie nieco niższym, niż wymagany na Metodach programowania), nie zaszkodzi znajomość podstawowych pojęć z teorii językow formalnych (język regularny, bezkontekstowy, kontekstowy) Pewne zagadnienia będą ilustrowane za pomocą pakietu NLTK-Lite (Natural Language ToolKit), napisanego w Pythonie. Dobrze mieć zatem podstawową znajomość tego języka lub chęć poświęcenia 1-2 godzin na samodzielne nabycie tej znajomości.

Wykłady

Lista
Prowadzący Termin zajęć Limit Zapisani Kolejka
Paweł Rychlikowski
pn 14:15-16:00 (s. 25) 200 42 0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.

Ćwiczenio-pracownie

Lista
Prowadzący Termin zajęć Limit Zapisani Kolejka
Adam Kaczmarek
wt 12:15-14:00 (s. 4, 7) 18 10 0
Marek Szykuła
śr 12:15-14:00 (s. 103, 110) 18 14 0
Paweł Rychlikowski
pn 16:15-18:00 (s. 137, 139) 18 18 0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.


Konsultacje prowadzących:


Imię i nazwisko Pokój Konsultacje
Adam Kaczmarek 202 Czwartek 12-14 (Proszę o wcześniejszy kontakt mailowy)
Paweł Rychlikowski 302 Konsultacje w semestrze *letnim* roku akademickiego 2023/2024 będą w czwartki w godzinach 12.15-14.00
Marek Szykuła 312 E-mail, Discord lub Teams.