Wydział Informatyki
Kierunek studiów Data Science Poziom i forma studiów pierwszego stopnia inżynierskie stacjonarne
Specjalność / Ścieżka dyplomowania --- Profil kształcenia ogólnoakademicki
Nazwa przedmiotu Uczenie maszynowe 1 Kod przedmiotu DS1S3UM1
Rodzaj przedmiotu obowiązkowy
Forma zajęć i liczba godzin W Ć L P Ps T S Semestr 3
30 30 Punkty ECTS 5
Przedmioty wprowadzające Algebra liniowa 2 (DS1S2AL2),   Analiza matematyczna 2 (DS1S2AM2),   Podstawy programowania (DS1S1PPR),   Rachunek prawdopodobieństwa (DS1S2RPR),  
Cele przedmiotu

Przekazanie fundamentalnej wiedzy z zakresu uczenia maszynowego, ze szczególnym uwzględnieniem metod uczenia nadzorowanego i nienadzorowanego. Rozwój praktycznych umiejętności implementacji, oceny i dostrajania modeli uczenia maszynowego na rzeczywistych zbiorach danych.

Odniesienia do frameworka edukacyjnego mikrokompetencji SFIA:
Machine Learning MLNG - poziom 3
Data Science DATS - poziom 3
Data Engineering DENG - poziom 2
Programming/Software Development PROG - poziom 2
Data Analytics DAAN - poziom 2

Treści programowe

Podstawy teoretyczne uczenia maszynowego, teoria uczenia statystycznego. Metody uczenia nadzorowanego: klasyfikacja i regresja, od modeli liniowych po złożone modele drzewiaste. Uczenie nienadzorowane: klastrowanie i redukcja wymiarowości. Metody zespołowe, walidacja i ocena modeli, strojenie hiperparametrów. Przetwarzanie danych, regularyzacja, ocena jakości modeli.

Wykład:
1 Wprowadzenie do uczenia maszynowego: podstawowe pojęcia i definicje, typy uczenia maszynowego, przykłady zastosowań, charakterystyka problemów ML. 
2 Teoretyczne podstawy ML: teoria uczenia statystycznego, PAC learning, kompromis między obciążeniem a wariancją, problem nadmiernego dopasowania. 
3 Preprocessing i inżynieria cech: przygotowanie danych, transformacje, selekcja i ekstrakcja cech, problem wymiarowości, obsługa danych niezbalansowanych. 
4 Regresja liniowa: model regresji prostej i wielorakiej, metoda najmniejszych kwadratów, założenia modelu, diagnostyka i interpretacja. 
5 Zaawansowane metody regresji: regresja wielomianowa, regresja z regularyzacją (ridge, lasso, elastic net), funkcje sklejane.
6 Regresja logistyczna, analiza dyskryminacyjna.
7 Drzewa decyzyjne. 
8 Ewaluacja i dostrajanie modeli: metody walidacji, miary jakości, krzywe ROC/PR, strojenie hiperparametrów, wybór modelu. 
9 Maszyny wektorów nośnych (SVM). 
10 Metody jądrowe. 
11 Metody zespołowe: lasy losowe, bagging, boosting (AdaBoost, Gradient Boosting), stacking, konstrukcja i optymalizacja zespołów klasyfikatorów. 
12 Uczenie nienadzorowane.
13 Uczenie nienadzorowane: algorytmy klastrowania (k-means, hierarchiczne, spektralne). 
14 Redukcja wymiarowości (PCA). 
15 Obsługa danych niezbalansowanych.

Pracownia specjalistyczna:
1 Wprowadzenie do narzędzi ML: konfiguracja środowiska Python, Jupyter Notebook, podstawy bibliotek NumPy, Pandas, Scikit-learn, pierwsze eksperymenty z danymi.
2 Eksploracyjna analiza danych (EDA): ładowanie i wizualizacja danych, statystyki opisowe, analiza rozkładów i korelacji, identyfikacja outlierów.
3 Preprocessing danych: czyszczenie danych, obsługa brakujących wartości, kodowanie zmiennych kategorycznych, skalowanie i normalizacja.
4 Regresja liniowa.
5 Regularyzacja.
6 Podstawowe modele klasyfikacji.
7 Zaawansowane modele klasyfikacji.
8 Metody zespołowe: bagging, boosting, stacking, wybór i optymalizacja modeli zespołowych.
9 Uczenie nienadzorowane: algorytmy klastrowania (k-means, hierarchiczne).
10 Redukcja wymiarowości (PCA), wizualizacja wyników.
11 Projekt końcowy.
12 Projekt końcowy.
13 Projekt końcowy.
14 Projekt końcowy.
15 Zaliczenie pracowni specjalistycznej.

Metody dydaktyczne

wykład konwersatoryjny,   wykład problemowy,   wykład z prezentacją multimedialną,   programowanie z użyciem komputera,  

Forma zaliczenia

W: egzamin pisemny z pytaniami otwartymi i zamkniętymi
Ps: sprawozdania; projekty

Symbol efektu uczenia się Zakładane efekty uczenia się Odniesienie do kierunkowych efektów uczenia się
EU1 podstawowe algorytmy i metody uczenia maszynowego DS1_W02
DS1_W05
DS1_W07
DS1_W09
DS1_W16
EU2 metody oceny i walidacji modeli uczenia maszynowego DS1_W07
DS1_W17
EU3 przygotowywać dane do uczenia maszynowego DS1_U05
DS1_U09
DS1_U19
EU4 implementować, oceniać i dostrajać modele uczenia maszynowego DS1_U06
DS1_U09
DS1_U10
DS1_U17
DS1_U19
Symbol efektu uczenia się Sposób weryfikacji efektu uczenia się Forma zajęć na której zachodzi weryfikacja
EU1 egzamin pisemny W
EU2 egzamin pisemny W
EU3 ocena sprawozdań i projektów Ps
EU4 ocena sprawozdań i projektów Ps
Bilans nakładu pracy studenta (w godzinach) Liczba godz.
Wyliczenie
1 - udziałem w wykładach 30
2 - udziałem w innych formach zajęć 30
3 - indywidualnym wsparciem merytorycznym procesu uczenia się, udziałem w egzaminie i zaliczeniach organizowanych poza planem zajęć 4
4 - przygotowaniem do egzaminu 10
5 - przygotowaniem do bieżących zajęć 51
RAZEM: 125
Wskaźniki ilościowe GODZINY ECTS
Nakład pracy studenta związany z zajęciami wymagającymi bezpośredniego udziału nauczyciela 64
(1)+(2)+(3)
2.6
Nakład pracy studenta związany z zajęciami o charakterze praktycznym 81
(2)+(5)
3.2
Literatura podstawowa

1 A. Król-Nowak, K. Kotarba, Podstawy uczenia maszynowego, Wydawnictwo AGH, 2022
2 C. Janiesch, P. Zschech, K. Heinrich, Machine Learning and Deep Learning, Springer, 2021
3 A. J. Gutman, J. Goldmeier, Analityk danych: przewodnik po data science, statystyce i uczeniu maszynowym, Helion, Gliwice, 2023
4 G. James, D. Witten, T. Hastie, R. Tibshirani, An Introduction to Statistical Learning with Applications in Python, Springer 2023
5 Hearty, J., Zaawansowane uczenie maszynowe z językiem Python, Helion, 2017

Literatura uzupełniająca

1 D. Stephenson, Big Data, nauka o danych i AI bez tajemnic: podejmuj lepsze decyzje i rozwijaj swój biznes!, Helion, Gliwice, 2020
2 J. Szymański (red.), Uczenie maszynowe i systemy rozproszone, Wydawnictwo Politechniki Gdańskiej, 2021

Jednostka realizująca Wydział Informatyki Data opracowania programu
Program opracował(a) dr hab. Marek J. Drużdżel,dr hab. inż. Małgorzata Krętowska,dr inż. Urszula Kużelewska,dr inż. Tomasz Łukaszuk 2025.03.03