Karta Przedmiotu

Politechnika Białostocka Wydział Informatyki
Kierunek studiów Data Science Poziom i forma
studiów
pierwszego stopnia
stacjonarne
Grupa przedmiotów /
specjalność
Profil kształcenia ogólnoakademicki
Nazwa przedmiotu Bazy i hurtownie danych E Kod przedmiotu DS1S2BHD
Rodzaj zajęć obowiązkowy
Formy zajęć i liczba godzin W Ć L P Ps T S Semestr 2
30 30 Punkty ECTS 5
Program obowiązuje od 2025/2026
Przedmioty wprowadzające Wstęp do Data Science (DS1S1WDS),  
Cele przedmiotu Przekazanie kompleksowej wiedzy z zakresu projektowania, implementacji i zarządzania bazami oraz hurtowniami danych, z uwzględnieniem specyfiki systemów analitycznych.
Rozwój praktycznych umiejętności w zakresie modelowania danych, implementacji systemów bazodanowych i tworzenia rozwiązań, które są podstawą systemów Business Intelligence.

Odniesienia do frameworka edukacyjnego mikrokompetencji SFIA:
Database Design DBDS - poziom 3
Data Management DATM - poziom 3
Data Engineering DENG - poziom 3
Data Modelling and Design DTAN - poziom 3
Ramowe treści programowe Wprowadzenie do systemów baz danych i hurtowni danych, ich architektury oraz różnic między rozwiązaniami OLTP i OLAP. Modelowanie danych w kontekście relacyjnym i wymiarowym, wykorzystanie SQL oraz zaawansowanych zapytań analitycznych. Procesy integracji i przetwarzania danych (ETL) oraz ich automatyzacja. Przegląd platform bazodanowych, zarządzanie metadanymi i jakością danych. Nowoczesne architektury danych, w tym systemy NoSQL i data lake. Aspekty bezpieczeństwa i wydajności systemów bazodanowych. Projektowanie, implementacja i optymalizacja baz danych oraz hurtowni danych, w tym modelowanie wymiarowe i integracja danych. Praca z różnymi systemami bazodanowymi, zarządzanie jakością i bezpieczeństwem danych.
Inne informacje o przedmiocie przedmiot ma związek z prowadzoną na Uczelni działalnością naukową
Wyliczenie: Nakład pracy studenta związany z: Godzin
ogółem
W tym
kontaktowych
W tym
praktycznych
udziałem w wykładach 30 30
udziałem w innych formach zajęć 30 30 30
indywidualnym wsparciem merytorycznym procesu uczenia się, udziałem w zaliczeniach organizowanych poza planem zajęć 4 4
przygotowaniem do egzaminu 16
przygotowaniem do zaliczenia wykładu 10
przygotowaniem do bieżących zajęć 35 35
Razem godzin: 125 64 65
Razem punktów ECTS: 5 2.6 2.6
Zakładane kierunkowe efekty uczenia się Wiedza Umiejętności Kompetencje
społeczne
DS1_W05 DS1_U04 DS1_K03 (H1_K01)
DS1_W06 DS1_U07 DS1_K05
DS1_W10 DS1_U11
DS1_W11 DS1_U16
DS1_W15
DS1_W17
Cele i treści ramowe sformułował(a) dr inż. Eugenia Busłowska, dr hab. inż. Agnieszka Drużdżel, dr inż. Paweł Tadejko Data: 29/05/2025
Realizacja w roku akademickim 2025/2026
 
Treści programowe
Wykład
1. Wprowadzenie do systemów bazodanowych. Architektura systemów OLTP i OLAP
2. Porównanie różnych podejść do przechowywania i przetwarzania danych
3. Modelowanie relacyjne. Projektowanie schematów baz danych, normalizacja i denormalizacja. Modelowanie związków między encjami w kontekście analitycznym
4. Język SQL. Zapytania analityczne, funkcje okienkowe, procedury składowane. Zapytania złożone. Podzapytania
5. Optymalizacja zapytań w kontekście dużych zbiorów danych
6. Hurtownie danych. Architektura i komponenty hurtowni danych. Koncepcja hurtowni danych w porównaniu z systemami opartymi na relacyjnym modelu
7. Koncepcja kostki danych. Wymiary i fakty. Modelowanie wymiarowe i schematy gwiaździste
8. Procesy ETL. Projektowanie i implementacja procesów ekstrakcji, transformacji i ładowania danych
9. Architektura systemów ładowania danych. Warstwy pośrednie i ich rola. ETL kontra ELT we współczesnych hurtowniach. Zapewnienie jakości danych
10. Narzędzia DBMS oraz zarządzanie metadanymi, jakością danych i bezpieczeństwem w kontekście Data Governance, bezpieczeństwa i zgodności z regulacjami
11. Systemy NoSQL. Bazy dokumentowe, grafowe i kolumnowe. Wybór odpowiedniej technologii dla różnych przypadków użycia
12. Systemy NoSQL. Bazy dokumentowe, grafowe i kolumnowe. Wybór odpowiedniej technologii dla różnych przypadków użycia
13. Koncepcja Data Lake i Modern Data Stack. Architektura nowoczesnych rozwiązań do przechowywania i analizy danych Business Intelligence
14. Koncepcja Data Lake i Modern Data Stack. Architektura nowoczesnych rozwiązań do przechowywania i analizy danych Business Intelligence
15. Integracja różnych źródeł danych
Pracownia specjalistyczna
1. Projektowanie baz danych: modelowanie relacyjne; implementacja schematów; optymalizacja struktur danych
2. Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań
3. Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań
4. Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań
5. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
6. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
7. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
8. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
9. Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów
10. Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów
11. Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów
12. Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi
13. Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi
14. Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi
15. Zaliczenie pracowni specjalistycznej
Metody dydaktyczne
(realizacja stacjonarna)
W wykład problemowy; wykład konwersatoryjny; wykład z prezentacją multimedialną
Ps zadania projektowe w grupach; dyskusja rozwiązań
Metody dydaktyczne
(realizacja zdalna)
W wykład problemowy; wykład konwersatoryjny; wykład z prezentacją multimedialną
-
Forma zaliczenia
W egzamin pisemny z pytaniami otwartymi
Ps opracowanie zadań projektowych realizowanych w grupach
Warunki zaliczenia
W Uzyskanie min. 30% z każdego E1-E3, a po spełnieniu tego warunku ostateczna ocena wynika z sumy uzyskanych punktów.
Kryteria oceny:
[ 0 – 50]% punktów – 2.0
(50 – 60]% punktów – 3.0
(60 – 70]% punktów – 3.5
(70 – 80]% punktów – 4.0
(80 – 90]% punktów – 4.5
(90 – 100]% punktów – 5.0
Ps Uzyskanie min. 30% z każdego E4-E7, a po spełnieniu tego warunku ostateczna ocena wynika z sumy uzyskanych punktów.
Kryteria oceny:
[ 0 – 50]% punktów – 2.0
(50 – 60]% punktów – 3.0
(60 – 70]% punktów – 3.5
(70 – 80]% punktów – 4.0
(80 – 90]% punktów – 4.5
(90 – 100]% punktów – 5.0
Symbol efektu Zakładane efekty uczenia się Odniesienie do efektów uczenia się zdefiniowanych dla kierunku studiów
Wiedza Umiejętności Kompetencje
społeczne
Wiedza: student zna i rozumie
E1 zasady projektowania i implementacji systemów bazodanowych i hurtowni danych
E2 różnice między systemami OLTP i OLAP oraz ich zastosowania
E3 pojęcia, metody integracji i zarządzania danymi związane z obszarem ETL
Umiejętności: student potrafi
E4 projektować i implementować systemy bazodanowe i hurtownie danych
E5 analizować, budować i optymalizować zapytania SQL
E6 implementować procesy ETL i zapewniać jakość danych
Kompetencje społeczne: student jest gotów do
E7 dbania o jakość i bezpieczeństwo danych w organizacji
Symbol efektu Sposób weryfikacji efektu uczenia się Forma zajęć na której zachodzi weryfikacja
E1 egzamin pisemny W
E2 egzamin pisemny W
E3 egzamin pisemny W
E4 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
E5 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
E6 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
E7 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
Literatura podstawowa
1. M.J. Hernandez, Projektowanie baz danych dla każdego: przewodnik krok po kroku, Helion, Gliwice, 2022
2. A. DeBarros, SQL w praktyce: jak dzięki danym uzyskiwać cenne informacje, Helion, Gliwice, 2024
3. J.L. Viescas, D.J.Steele, B.G. Clothier, Mistrzowski SQL: 61 technik pisania wydajnego kodu SQL, Helion, Gliwice, 2017
4. R.M.P. Teate, SQL dla analityków danych: tworzenie zbiorów danych dla początkujących, Helion, Gliwice, 2023
5. A. Chodkowska-Gyurics, Hurtownie danych: teoria i praktyka, Wydawnictwo Naukowe PWN, Warszawa, 2017
Literatura uzupełniająca
1. L. Campbell, C. Majors, Inżynieria niezawodnych baz danych: projektowanie systemów odpornych na błędy, Helion, Gliwice, 2018
2. J. Reis, M. Housley, Inżynieria danych w praktyce: kluczowe koncepcje i najlepsze technologie, Helion, Gliwice, 2023
3. D. Vaughan, Umiejętności analityczne w pracy z danymi i sztuczną inteligencją: wykorzystywanie najnowszych technologii w rozwijaniu przedsiębiorstwa, Helion, Gliwice, 2021
Koordynator przedmiotu: dr inż. Eugenia Busłowska, dr hab. inż. Agnieszka Drużdżel, dr hab. inż. Małgorzata Krętowska Data: 03/03/2025