Wydział Informatyki
Kierunek studiów Informatyka Poziom i forma studiów pierwszego stopnia inżynierskie stacjonarne
Specjalność / Ścieżka dyplomowania --- Profil kształcenia ogólnoakademicki
Nazwa przedmiotu Uczenie maszynowe w przetwarzaniu dźwięku Kod przedmiotu INF1UMD
Rodzaj przedmiotu obieralny
Forma zajęć i liczba godzin W Ć L P Ps T S Semestr 5
26 30 Punkty ECTS 5
Przedmioty wprowadzające Przetwarzanie sygnałów i obrazów (INF1PSO),  
Cele przedmiotu

Wprowadzenie studentów do metod słyszenia maszynowego. Po ukończeniu zajęć w ramach niniejszego przedmiotu studenci będą w stanie scharakteryzować wybrane metody słyszenia maszynowego i zaimplementować je przy użyciu wysokopoziomowych języków programowania takich jak MATLAB lub Python.

Odniesienie do standardu SFIA:
- Uczenie maszynowe (MLNG) – poziom 3
- Sztuczna inteligencja (AI) i etyka danych (AIDE) – poziom 3

Treści programowe

Wykłady:
1. Przegląd metod i technik stosowanych w aplikacjach słyszenia maszynowego.
2. Metody analizy oraz syntezy dźwięku.
3. Metody parametryzacji i reprezentacji dźwięku na potrzeby uczenia maszynowego.
4. Rozpoznawanie mowy i mówcy. Automatyczne rozpoznawanie emocji mówcy.
5. Wydobywanie informacji z muzyki.
6. Automatyczna klasyfikacja zdarzeń dźwiękowych i scen akustycznych.
7. Analiza przestrzennych scen dźwiękowych.
8. Przegląd algorytmów generatywnych audio.
9. Zaliczenie wykładu.

Pracowania specjalistyczna:
1. Implementacja metod przetwarzania wstępnego dźwięku.
2. Parametryzacja dźwięku.
3. Klasyfikacja zdarzeń dźwiękowych.
4. Projekt 1: Implementacja wybranego algorytmu z dziedziny rozpoznawania mowy, klasyfikacji dźwięku, wydobywania informacji muzycznej lub rozpoznawania emocji.
5. Projekt 2: Implementacja metody analizy lub przetwarzania dźwięku w czasie rzeczywistym.
6. Zaliczenie pracowni.

Metody dydaktyczne

programowanie z użyciem komputera,   metoda projektów,   wykład informacyjny,  

Forma zaliczenia

Wykład: Test wyboru
Pracowania specjalistyczna: Ocena sprawozdań. Prezentacja i ocena zrealizowanych projektów programistycznych.

Symbol efektu uczenia się Zakładane efekty uczenia się Odniesienie do kierunkowych efektów uczenia się
EU1 podstawowe pojęcia, metody i techniki z zakresu słyszenia maszynowego INF1_W14
EU2 metody parametryzacji oraz reprezentacji sygnałów dźwiękowych na potrzeby uczenia maszynowego INF1_W10
INF1_W14
EU3 najnowsze trendy w dziedzinie słyszenia maszynowego INF1_W14
EU4 uzdatniać sygnały dźwiękowe INF1_U13
EU5 parametryzować i reprezentować sygnały dźwiękowe na potrzeby uczenia maszynowego INF1_U13
EU6 wykorzystywać biblioteki programistyczne wysokiego poziomu do analizy i przetwarzania dźwięku z użyciem metod uczenia maszynowego (e.g. MATLAB or Python) INF1_U13
EU7 krytycznej oceny kwestii etycznych związanych ze współczesnymi metodami analizy i przetwarzania dźwięku INF1_K01
Symbol efektu uczenia się Sposób weryfikacji efektu uczenia się Forma zajęć na której zachodzi weryfikacja
EU1 test wyboru W
EU2 test wyboru W
EU3 test wyboru W
EU4 ocena sprawozdań, prezentacja i ocena zrealizowanych projektów programistycznych Ps
EU5 ocena sprawozdań, prezentacja i ocena zrealizowanych projektów programistycznych Ps
EU6 ocena sprawozdań, prezentacja i ocena zrealizowanych projektów programistycznych Ps
EU7 ocena sprawozdań, prezentacja i ocena zrealizowanych projektów programistycznych Ps
Bilans nakładu pracy studenta (w godzinach) Liczba godz.
Wyliczenie
1 - udziałem w wykładach 26
2 - udziałem w innych formach zajęć (pracownia specjalistyczna) 30
3 - indywidualnym wsparciem merytorycznym procesu uczenia się, udziałem w egzaminie/zaliczeniach organizowanych poza planem zajęć 4
4 - przygotowaniem do zaliczenia wykładu 5
5 - przygotowaniem do bieżących zajęć 60
RAZEM: 125
Wskaźniki ilościowe GODZINY ECTS
Nakład pracy studenta związany z zajęciami wymagającymi bezpośredniego udziału nauczyciela 60
(1)+(2)+(3)
2.4
Nakład pracy studenta związany z zajęciami o charakterze praktycznym 30
(2)
1.2
Literatura podstawowa

1. U. Zölzer, DAFX: Digital Audio Effects, Wiley, 2011
2. W. Wang, Machine Audition: Principles, Algorithms and Systems. Information science reference. New York, 2010
3. D. L. Wang and G. J. Brown. Computational auditory scene analysis: Principles, algorithms and applications. IEEE Press/Wiley-Interscience, 2006
4. A. Bregman, Auditory Scene Analysis. Cambridge: MIT Press, 1990

Literatura uzupełniająca

1. K. Steiglitz, A Digital Signal Processing Primer: with Applications to Digital Audio and Computer Music, Dover Publications, 2020
2. C.L. Bennett, Digital Audio Theory: A Practical Guide, Focal Press, 2020
3. Z. Raś and A. Wieczorkowska, Advances in Music Information Retrieval. Studies in Computational Intelligence, Springer-Verlag, Berlin, 2010

Jednostka realizująca Katedra Mediów Cyfrowych i Grafiki Komputerowej Data opracowania programu
Program opracował(a) dr hab. inż. Sławomir Zieliński 2025.02.23