Wydział Informatyki
Kierunek studiów Informatyka i ekonometria Poziom i forma studiów pierwszego stopnia inżynierskie stacjonarne
Specjalność / Ścieżka dyplomowania --- Profil kształcenia praktyczny
Nazwa przedmiotu Introduction to Machine Audition Kod przedmiotu IE1IMA_EN
Rodzaj przedmiotu obieralny
Forma zajęć i liczba godzin W Ć L P Ps T S Semestr 5/6
15 45 Punkty ECTS 4
Przedmioty wprowadzające Sztuczna inteligencja (IE1SIN),  
Cele przedmiotu

Wprowadzenie studentów do współczesnych metod słyszenia maszynowego. Po ukończeniu zajęć w ramach niniejszego przedmiotu studenci będą w stanie scharakteryzować wybrane metody słyszenia maszynowego i zaimplementować je przy użyciu wysokopoziomowych języków programowania takich jak MATLAB lub Python.

Treści programowe

Wykład:
1. Słyszenie maszynowe – Kluczowe pojęcia oraz przegląd dziedziny
2. Rozpoznawanie mowy i mówcy
3. Wydobywanie informacji muzycznych: rozpoznawanie gatunków muzyki, charakteryzowanie harmonii, rytmu, brzmienia; detekcja wysokości dźwięku
4. Automatyczna klasyfikacja dźwięków
5. Komputerowa analiza scen dźwiękowych, ślepa separacja sygnałów audio
6. Percepcja dźwięku, rozpoznawanie emocji
7. Automatyczna lokalizacja zdarzeń dźwiękowych

Pracownia specjalistyczna:
1. Implementacja algorytmów uzdatniania i przetwarzania sygnałów mowy i dźwięku
2. Implementacja algorytmu parametryzacji dźwięku
3. Implementacja wybranego algorytmu z dziedziny rozpoznawania mowy, klasyfikacji dźwięku, wydobywania informacji muzycznej lub rozpoznawania emocji
4. Implementacja prostej metody analizy dźwięku w czasie rzeczywistym

Metody dydaktyczne

pokaz,   programowanie z użyciem komputera,   metoda projektów,   wykład informacyjny,  

Forma zaliczenia

Wykład: zaliczenie pisemne.
Pracownia specjalistyczna: sprawozdanie oraz ustna obrona projektów komputerowych.

Symbol efektu uczenia się Zakładane efekty uczenia się Odniesienie do kierunkowych efektów uczenia się
E1 umie wymienić, scharakteryzować i porównać podstawowe metody wykorzystywane do celów słyszenia maszynowego K_W04
K_W09
E2 zna najnowsze trendy w dziedzinie słyszenia maszynowego; jest świadomy możliwości i ograniczeń najnowszych algorytmów. K_W04
K_W09
E3 posiada podstawowe umiejętności uzdatniania, przetwarzania i analizy sygnałów dźwiękowych. K_U02
K_U03
K_U04
K_U09
E4 potrafi zaimplementować algorytmy parametryzacji dźwięku. K_U04
K_U09
E5 potrafi zaimplementować wybrane algorytmy słyszenia maszynowego z użyciem wysokopoziomowych języków programowania (np. MATALB lub Python) K_U04
K_U09
E6 potrafi implementować proste algorytmów słyszenia maszynowego w czasie rzeczywistym. K_U04
K_U09
Symbol efektu uczenia się Sposób weryfikacji efektu uczenia się Forma zajęć na której zachodzi weryfikacja
E1 zaliczenie pisemne W
E2 zaliczenie pisemne W
E3 sprawozdania projektów oraz ich ustna obrona Ps
E4 sprawozdania projektów oraz ich ustna obrona Ps
E5 sprawozdania projektów oraz ich ustna obrona Ps
E6 sprawozdania projektów oraz ich ustna obrona Ps
Bilans nakładu pracy studenta (w godzinach) Liczba godz.
Wyliczenie
1 - Uczestnictwo w wykładach - 15 x 1 15
2 - Uczestnictwo w pracowniach specjalistycznych - 15 x 3 45
4 - Praca własna i przygotowanie do testu zaliczeniowego 7
5 - Udział w konsultacjach 5
6 - Opracowanie projektów 28
RAZEM: 100
Wskaźniki ilościowe GODZINY ECTS
Nakład pracy studenta związany z zajęciami wymagającymi bezpośredniego udziału nauczyciela 65
(1)+(2)+(5)
2.6
Nakład pracy studenta związany z zajęciami o charakterze praktycznym 73
(2)+(6)
2.9
Literatura podstawowa

1. P. Knees, M. Schedl, Music Similarity and Retrieval: An Introduction to Audio- and Web-based Strategies, Springer, 2016.
2. A. Lerch, An Introduction to Audio Content Analysis: Applications in Signal Processing and Music Informatics, Wiley-IEEE Press, 2012.
3. W. Wang, Machine Audition: Principles, Algorithms and Systems. Information science reference. New York, 2010.
4. D.L. Wang and G. J. Brown. Computational auditory scene analysis: Principles, algorithms and applications. IEEE Press/Wiley-Interscience, 2006.

Literatura uzupełniająca

1. Z. Raś and A. Wieczorkowska, Advances in Music Information Retrieval. Studies in Computational Intelligence, Springer-Verlag, Berlin, 2010.
2. A. Bregman, Auditory Scene Analysis. Cambridge: MIT Press, 1990.

Jednostka realizująca Katedra Mediów Cyfrowych i Grafiki Komputerowej Data opracowania programu
Program opracował(a) dr hab. inż. Sławomir Zieliński 2021.04.28