Wraz z rozwojem technologii informacyjnej rośnie rola syntezy i analizy mowy,
ktore zapewne w przyszłości będą głownymi sposobami komunikacji człowieka i
komputera.
Niniejszy wykład poświęcony będzie syntezie mowy, czyli procesowi
przekształcania tekstu na zapis fali dźwiękowej, ktory umożliwia odtworzenie
oryginalnego tekstu i dodatkowo możliwie jak najbardziej przypomina ludzki
sposob odczytania tekstu. W wielu sytuacjach używanie syntezatora ułatwia
korzystanie z komputera (czytanie maili, dostęp telefoniczny, ...), a czasami
wręcz umożliwia (np. czytanie tekstu "z ekranu" przez niewidomych).
Wykład ma kilka celow:
1. zrozumienie mechanizmow używanych na rożnych poziomach syntezy mowy
2. napisanie własnego syntezatora mowy (ktorego mowę da się zrozumieć)
3. zapoznanie się z obecnie używanymi systemami syntezy mowy oraz narzędziami używanymi w ich tworzeniu
4. zorientowanie się w wyzwaniach stojących przed syntezą mowy
**Program:**
1. Definicja problemu Text-to-speech
2. Podział tekstu na słowa i zdania
3. Przetwarzanie tekstu zgodne z potrzebami syntezatora (dezambiguacja homonimow, sposoby czytania skrotow i skrotowcow, liczby i inne jednostki nieleksykalne).
4. Wyznaczanie prozodii na podstawie analizy tekstu (podział na frazy, wybor akcentu zdaniowego, ustalanie linii prozodycznej)
5. Podstawy fonetyki i fonologii (sposob działania narządow mowy, akustyczna charakterystyka mowy, akcent wyrazowy, wyznaczanie czasu trwania głosek)
6. Wymowa (sposob przekształcania ciągu liter na ciąg fonemow -- Grapheme-to-phoneme conversion)
7. Fizyczna realizacja prozodii
8. Filtrowanie sygnałow akustycznych
9. Korpusowa synteza mowy
10. Podstawy analizy mowy i możliwości skorzystania z analizy mowy przy syntezie mowy.
Konsultacje w semestrze *letnim* roku akademickiego 2024/2025 będą we wtorki w godzinach 14-15 oraz w czwartki w godzinach 15-16 Można też umawiać się na konsultacje w innych terminach