Karta Przedmiotu

Politechnika Białostocka Wydział Informatyki
Kierunek studiów Data Science Poziom i forma
studiów
pierwszego stopnia
stacjonarne
Grupa przedmiotów /
specjalność
Profil kształcenia ogólnoakademicki
Nazwa przedmiotu Uczenie maszynowe 1 E Kod przedmiotu DS1S3UM1
Rodzaj zajęć obowiązkowy
Formy zajęć i liczba godzin W Ć L P Ps T S Semestr 3
30 30 Punkty ECTS 5
Program obowiązuje od 2025/2026
Przedmioty wprowadzające Algebra liniowa 2 (DS1S2AL2),   Analiza matematyczna 2 (DS1S2AM2),   Podstawy programowania (DS1S1PPR),   Rachunek prawdopodobieństwa (DS1S2RPR),  
Cele przedmiotu Przekazanie fundamentalnej wiedzy z zakresu uczenia maszynowego, ze szczególnym uwzględnieniem metod uczenia nadzorowanego i nienadzorowanego. Rozwój praktycznych umiejętności implementacji, oceny i dostrajania modeli uczenia maszynowego na rzeczywistych zbiorach danych.

Odniesienia do frameworka edukacyjnego mikrokompetencji SFIA:
Machine Learning MLNG - poziom 3
Data Science DATS - poziom 3
Data Engineering DENG - poziom 2
Programming/Software Development PROG - poziom 2
Data Analytics DAAN - poziom 2
Ramowe treści programowe Podstawy teoretyczne uczenia maszynowego, teoria uczenia statystycznego. Metody uczenia nadzorowanego: klasyfikacja i regresja, od modeli liniowych po złożone modele drzewiaste. Uczenie nienadzorowane: klastrowanie i redukcja wymiarowości. Metody zespołowe, walidacja i ocena modeli, strojenie hiperparametrów. Przetwarzanie danych, regularyzacja, ocena jakości modeli.
Inne informacje o przedmiocie przedmiot ma związek z prowadzoną na Uczelni działalnością naukową
Wyliczenie: Nakład pracy studenta związany z: Godzin
ogółem
W tym
kontaktowych
W tym
praktycznych
udziałem w wykładach 30 30
udziałem w innych formach zajęć 30 30 30
indywidualnym wsparciem merytorycznym procesu uczenia się, udziałem w egzaminie i zaliczeniach organizowanych poza planem zajęć 4 4
przygotowaniem do egzaminu 10
przygotowaniem do bieżących zajęć 51 51
Razem godzin: 125 64 81
Razem punktów ECTS: 5 2.6 3.2
Zakładane kierunkowe efekty uczenia się Wiedza Umiejętności Kompetencje
społeczne
DS1_W02 DS1_U05
DS1_W05 DS1_U06
DS1_W07 DS1_U09
DS1_W09 DS1_U10
DS1_W16 DS1_U17
DS1_W17 DS1_U19
Cele i treści ramowe sformułował(a) dr hab. inż. Małgorzata Krętowska Data: 29/05/2025
Realizacja w roku akademickim 2026/2027
 
Treści programowe
Wykład
1. Wprowadzenie do uczenia maszynowego: podstawowe pojęcia i definicje, typy uczenia maszynowego, przykłady zastosowań, charakterystyka problemów ML.
2. Teoretyczne podstawy ML: teoria uczenia statystycznego, PAC learning, kompromis między obciążeniem a wariancją, problem nadmiernego dopasowania.
3. Preprocessing i inżynieria cech: przygotowanie danych, transformacje, selekcja i ekstrakcja cech, problem wymiarowości, obsługa danych niezbalansowanych.
4. Regresja liniowa: model regresji prostej i wielorakiej, metoda najmniejszych kwadratów, założenia modelu, diagnostyka i interpretacja.
5. Zaawansowane metody regresji: regresja wielomianowa, regresja z regularyzacją (ridge, lasso, elastic net), funkcje sklejane.
6. Regresja logistyczna, analiza dyskryminacyjna.
7. Drzewa decyzyjne.
8. Ewaluacja i dostrajanie modeli: metody walidacji, miary jakości, krzywe ROC/PR, strojenie hiperparametrów, wybór modelu.
9. Maszyny wektorów nośnych (SVM).
10. Metody jądrowe.
11. Metody zespołowe: lasy losowe, bagging, boosting (AdaBoost, Gradient Boosting), stacking, konstrukcja i optymalizacja zespołów klasyfikatorów.
12. Uczenie nienadzorowane.
13. Uczenie nienadzorowane: algorytmy klastrowania (k-means, hierarchiczne, spektralne).
14. Redukcja wymiarowości (PCA).
15. Obsługa danych niezbalansowanych.
Pracownia specjalistyczna
1. Wprowadzenie do narzędzi ML: konfiguracja środowiska Python, Jupyter Notebook, podstawy bibliotek NumPy, Pandas, Scikit-learn, pierwsze eksperymenty z danymi.
2. Eksploracyjna analiza danych (EDA): ładowanie i wizualizacja danych, statystyki opisowe, analiza rozkładów i korelacji, identyfikacja outlierów.
3. Preprocessing danych: czyszczenie danych, obsługa brakujących wartości, kodowanie zmiennych kategorycznych, skalowanie i normalizacja.
4. Regresja liniowa.
5. Regularyzacja.
6. Podstawowe modele klasyfikacji.
7. Zaawansowane modele klasyfikacji.
8. Metody zespołowe: bagging, boosting, stacking, wybór i optymalizacja modeli zespołowych.
9. Uczenie nienadzorowane: algorytmy klastrowania (k-means, hierarchiczne).
10. Redukcja wymiarowości (PCA), wizualizacja wyników.
11. Projekt końcowy.
12. Projekt końcowy.
13. Projekt końcowy.
14. Projekt końcowy.
15. Zaliczenie pracowni specjalistycznej.
Metody dydaktyczne
(realizacja stacjonarna)
W wykład problemowy; wykład konwersatoryjny; wykład z prezentacją multimedialną
Ps realizacja sprawozdań; relizacja projektów
Metody dydaktyczne
(realizacja zdalna)
W wykład problemowy; wykład konwersatoryjny; wykład z prezentacją multimedialną
-
Forma zaliczenia
W egzamin pisemny z pytaniami otwartymi i zamkniętymi
Ps sprawozdania; projekty
Warunki zaliczenia
W Uzyskanie min. 30% z każdego E1-E2, a po spełnieniu tego warunku ostateczna ocena wynika z sumy uzyskanych punktów.
Kryteria oceny:
[ 0 – 50]% punktów – 2.0
(50 – 60]% punktów – 3.0
(60 – 70]% punktów – 3.5
(70 – 80]% punktów – 4.0
(80 – 90]% punktów – 4.5
(90 – 100]% punktów – 5.0
Ps Uzyskanie min. 30% z każdego E3-E4, a po spełnieniu tego warunku ostateczna ocena wynika z sumy uzyskanych punktów.
Kryteria oceny:
[ 0 – 50]% punktów – 2.0
(50 – 60]% punktów – 3.0
(60 – 70]% punktów – 3.5
(70 – 80]% punktów – 4.0
(80 – 90]% punktów – 4.5
(90 – 100]% punktów – 5.0
Symbol efektu Zakładane efekty uczenia się Odniesienie do efektów uczenia się zdefiniowanych dla kierunku studiów
Wiedza Umiejętności Kompetencje
społeczne
Wiedza: student zna i rozumie
E1 podstawowe algorytmy i metody uczenia maszynowego
E2 metody oceny i walidacji modeli uczenia maszynowego
Umiejętności: student potrafi
E3 przygotowywać dane do uczenia maszynowego
E4 implementować, oceniać i dostrajać modele uczenia maszynowego
Symbol efektu Sposób weryfikacji efektu uczenia się Forma zajęć na której zachodzi weryfikacja
E1 egzamin pisemny W
E2 egzamin pisemny W
E3 ocena sprawozdań i projektów Ps
E4 ocena sprawozdań i projektów Ps
Literatura podstawowa
1. A. Król-Nowak, K. Kotarba, Podstawy uczenia maszynowego, Wydawnictwo AGH, 2022
2. C. Janiesch, P. Zschech, K. Heinrich, Machine Learning and Deep Learning, Springer, 2021
3. A. J. Gutman, J. Goldmeier, Analityk danych: przewodnik po data science, statystyce i uczeniu maszynowym, Helion, Gliwice, 2023
4. G. James, D. Witten, T. Hastie, R. Tibshirani, An Introduction to Statistical Learning with Applications in Python, Springer 2023
5. Hearty, J., Zaawansowane uczenie maszynowe z językiem Python, Helion, 2017
Literatura uzupełniająca
1. D. Stephenson, Big Data, nauka o danych i AI bez tajemnic: podejmuj lepsze decyzje i rozwijaj swój biznes!, Helion, Gliwice, 2020
2. J. Szymański (red.), Uczenie maszynowe i systemy rozproszone, Wydawnictwo Politechniki Gdańskiej, 2021
Koordynator przedmiotu: dr hab. Marek J. Drużdżel, dr hab. inż. Małgorzata Krętowska, dr inż. Urszula Kużelewska, dr inż. Tomasz Łukaszuk Data: 03/03/2025