Przetwarzanie języka naturalnego zima 2018/19

Lista

Język wykładowy	Polski
Opiekun	Paweł Rychlikowski
Liczba godzin	30 (wyk.) 15 (prac.) 15 (ćw-prac.)
Rodzaj	I2.Z - zastosowania inf.
ECTS	6
Polecany dla I roku	Nie
Egzamin	Tak
Tagi	PD (przetwarzanie danych)

Opis przedmiotu:

Celem wykładu jest omówienie metod stosowanych w analizie i przetwarzaniu tekstów w języków naturalnych, ze szczególnym uwzględnieniem wyników, które można przełożyć na efektywnie działające implementacje. Największy nacisk położony będzie na technologie pasujące do języka polskiego. Będziemy zajmowali się takimi zadaniami, jak: * tworzeniem różnych modeli języka oraz stosowaniem ich do korekty błędów, rozpoznawania mowy czy też pisma * znajdowaniem struktury wypowiedzi * metodami ujednoznaczniania wypowiedzi, która może być odczytana na wiele sposobów (przykładowo w zdaniu: Janek je słonecznik i śmieci) * automatyczną analizą treści dokumentu, automatycznym określaniem tematyki dokumentu, czy * algorytmami streszczania * automatyczną generacją tekstu o określonych właściwościach * wyciąganiem użytecznej wiedzy z analizy bardzo dużych kolekcji tekstów Omówione zostaną między innymi następujące zagadnienia: łańcuchy Markowa, warunkowe pola losowe (CRF) różne formalizmy opisu języka (np. gramatyki atrybutowe, probabilistyczne gramatyki bezkonteksowe), traktowanie dokumentu jako multizbioru słów, różne algorytmy parsingu tekstów, parsing powierzchniowy oraz analiza zależności. Ponadto będziemy zajmować się współczesnymi metodami wykorzystującymi sieci neuronowe. Przedstawiona też zostanie potrzebna wiedza lingwistyczna, oczywiście z perspektywy informatyka. Zajęciami dodatkowymi, wspomagającymi zrozumienie materiału i odnoszącymi omawiane zagadnienia do sfery praktycznej, będą ćwiczenia połączone z pracownią. Od studenta oczekujemy zaliczenie Metod programowania, umiejętności programowania w języku wyższego rzędu. Nie zaszkodzi znajomość podstawowych pojęć z teorii języków formalnych (język regularny, bezkontekstowy, kontekstowy) Pewne zagadnienia będą ilustrowane za pomocą pakietu NLTK-Lite (Natural Language ToolKit), napisanego w Pythonie. Dobrze mieć zatem podstawową znajomość tego języka lub chęć poświęcenia 1-2 godzin na samodzielne nabycie tej znajomości.

Wykłady

Lista

Prowadzący	Termin zajęć	Limit	Zapisani	Kolejka
Paweł Rychlikowski	wt 16:00-18:00 (s. 25)	300	34	0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.

Ćwiczenio-pracownie

Lista

Prowadzący	Termin zajęć	Limit	Zapisani	Kolejka
Paweł Rychlikowski	pn 18:00-20:00 (s. 7, 103)	18	17	0
Paweł Rychlikowski	cz 12:00-14:00 (s. 7, 103)	18	17	0

UWAGA! Wyższa liczba oznacza wyższy priorytet, po zapisaniu do grupy zostajemy usunięci z kolejek o niższym priorytecie.

Konsultacje prowadzących:

Imię i nazwisko	Pokój	Konsultacje
Paweł Rychlikowski	302	Konsultacje w semestrze zimowym roku akademickiego 2025/2026 będą we wtorki w godzinach 11-12 oraz 14-15. Można też umawiać się na konsultacje w innych terminach (w szczególności, jeżeli nie ma Rady Wydziału, to o 12 jestem też dostępny) Uwaga: konsultacje 28.10 nie odbędą się. Osoby zainteresowane proszę o kontakt mailowy, znajdziemy inny termin.