Przetwarzanie języka naturalnego

Język wykładowy Polski
Semestr Zimowy
Status W ofercie
Opiekun Paweł Rychlikowski
Liczba godzin 30 (wyk.) 30 (ćw-prac.)
Rodzaj I2.Z - zastosowania inf.
ECTS 6
Polecany dla I roku Nie
Egzamin Tak
Tagi PD (przetwarzanie danych) DS (Data Science)

Opis przedmiotu:

Przetwarzanie języka naturalnego jest dziedziną, w której staramy się zrozumieć, czym jest język naturalny (taki jak polski czy angielski), jak go najlepiej modelować narzędziami matematycznymi bądź informatycznymi oraz tym, jakie praktyczne korzyści można wyciągnąć z tej wiedzy -- czyli jakie zadania związane z językiem da się skutecznie rozwiązywać za pomocą odpowiednich algorytmów. Język naturalny otacza nas zewsząd. Jest coraz więcej dostępnych tekstów, które badać i pozyskiwać z nich wiedzę o języku, rosną też ciągle oczekiwania rozumienia języka, jakie stawiamy algorytmom. I rzeczywiście w wielu aspektach obserwujemy ciągły wzrost skuteczności działania tych algorytmów (w wielu zadanich algorytmy osiągają sprawność lepszą niż ludzie. Z drugiej strony wiele zadań z przetwarzania języka uważa się za AI-zupełne (to znaczy, że w pełni satysfakcjonujące ich rozwiązanie wymaga stworzenia pełnej sztucznej inteligencji. Wymienić tu można choćby rozmowę na dowolny temat. Na wykładzie będziemy zajmować się zarówno "łatwymi", jak i "trudnymi" aspektami języka. Omówimy sposoby modelowania języka (traktowanego jako sekwencje elementów): bazujące na łańcucha Markowa oraz różnych architekturach sieci neuronowych. Poznamy elementy wiedzy lingwistycznej, poznamy sposoby analizy składniowej zdań. Dużo uwagi będzie poświęcone sposobami generacji tekstów, spełniających określone warunki. Będziemy zajmować się głównie metodami zawierającymi elementy uczenia maszynowego (czyli pozyskiwania wiedzy z danych, którymi są w tej dziedzinie zbiory tekstów, czasem z dodatkowymi anotacjami). Na pracowni będziemy wykonywać takie zadania jak: automatyczne poprawianie tekstu (np. rekonstrukcja polskich znaków diakrytycznych lub wielkich liter), znajdywaniem w tekstach fraz określonego typu (na przykład nazw organizacji, osób, dat, etc), generowaniem tekstów na zadany temat, automatycznym wykrywaniem "mowy nienawiści", analizą składniową i korektą błędów gramatycznych. W przypadku konieczności organizowania zajęć w formie zdalnej, studenci otrzymają nagrane wykłady, ćwiczenia będą w przeprowadzone z deklaracjami i wspólną pracą nad Raportem z ćwiczeń, zadania na pracownie będą konsultowane i odbierane przy użyciu systemu telekonferencyjnego.