Wydział Informatyki
Kierunek studiów Data Science Poziom i forma studiów pierwszego stopnia inżynierskie stacjonarne
Specjalność / Ścieżka dyplomowania --- Profil kształcenia ogólnoakademicki
Nazwa przedmiotu Bazy i hurtownie danych Kod przedmiotu DS1S2BHD
Rodzaj przedmiotu obowiązkowy
Forma zajęć i liczba godzin W Ć L P Ps T S Semestr 2
30 30 Punkty ECTS 5
Przedmioty wprowadzające Wstęp do Data Science (DS1S1WDS),  
Cele przedmiotu

Przekazanie kompleksowej wiedzy z zakresu projektowania, implementacji i zarządzania bazami oraz hurtowniami danych, z uwzględnieniem specyfiki systemów analitycznych.
Rozwój praktycznych umiejętności w zakresie modelowania danych, implementacji systemów bazodanowych i tworzenia rozwiązań, które są podstawą systemów Business Intelligence.

Odniesienia do frameworka edukacyjnego mikrokompetencji SFIA:
Database Design DBDS - poziom 3
Data Management DATM - poziom 3
Data Engineering DENG - poziom 3
Data Modelling and Design DTAN - poziom 3

Treści programowe

Wprowadzenie do systemów baz danych i hurtowni danych, ich architektury oraz różnic między rozwiązaniami OLTP i OLAP. Modelowanie danych w kontekście relacyjnym i wymiarowym, wykorzystanie SQL oraz zaawansowanych zapytań analitycznych. Procesy integracji i przetwarzania danych (ETL) oraz ich automatyzacja. Przegląd platform bazodanowych, zarządzanie metadanymi i jakością danych. Nowoczesne architektury danych, w tym systemy NoSQL i data lake. Aspekty bezpieczeństwa i wydajności systemów bazodanowych. Projektowanie, implementacja i optymalizacja baz danych oraz hurtowni danych, w tym modelowanie wymiarowe i integracja danych. Praca z różnymi systemami bazodanowymi, zarządzanie jakością i bezpieczeństwem danych.

Wykład:
1. Wprowadzenie do systemów bazodanowych. Architektura systemów OLTP i OLAP
2. Porównanie różnych podejść do przechowywania i przetwarzania danych
3. Modelowanie relacyjne. Projektowanie schematów baz danych, normalizacja i denormalizacja. Modelowanie związków między encjami w kontekście analitycznym
4. Język SQL. Zapytania analityczne, funkcje okienkowe, procedury składowane. Zapytania złożone. Podzapytania
5. Optymalizacja zapytań w kontekście dużych zbiorów danych
6. Hurtownie danych. Architektura i komponenty hurtowni danych. Koncepcja hurtowni danych w porównaniu z systemami opartymi na relacyjnym modelu
7. Koncepcja kostki danych. Wymiary i fakty. Modelowanie wymiarowe i schematy gwiaździste
8. Procesy ETL. Projektowanie i implementacja procesów ekstrakcji, transformacji i ładowania danych
9. Architektura systemów ładowania danych. Warstwy pośrednie i ich rola. ETL kontra ELT we współczesnych hurtowniach. Zapewnienie jakości danych
10. Narzędzia DBMS oraz zarządzanie metadanymi, jakością danych i bezpieczeństwem w kontekście Data Governance, bezpieczeństwa i zgodności z regulacjami
11. Systemy NoSQL. Bazy dokumentowe, grafowe i kolumnowe. Wybór odpowiedniej technologii dla różnych przypadków użycia
12. Systemy NoSQL. Bazy dokumentowe, grafowe i kolumnowe. Wybór odpowiedniej technologii dla różnych przypadków użycia
13. Koncepcja Data Lake i Modern Data Stack. Architektura nowoczesnych rozwiązań do przechowywania i analizy danych Business Intelligence
14. Koncepcja Data Lake i Modern Data Stack. Architektura nowoczesnych rozwiązań do przechowywania i analizy danych Business Intelligence
15. Integracja różnych źródeł danych

Pracownia specjalistyczna:
1. Projektowanie baz danych: modelowanie relacyjne; implementacja schematów; optymalizacja struktur danych
2. Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań
3. Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań
4. Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań
5. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
6. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
7. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
8. Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych
9. Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów
10. Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów
11. Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów
12. Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi
13. Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi
14. Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi
15. Zaliczenie pracowni specjalistycznej

Metody dydaktyczne

dyskusja rozwiązań,   metoda projektów,   wykład konwersatoryjny,   wykład problemowy,   wykład z prezentacją multimedialną,  

Forma zaliczenia

W: egzamin pisemny z pytaniami otwartymi
Ps: opracowanie zadań projektowych realizowanych w grupach

Symbol efektu uczenia się Zakładane efekty uczenia się Odniesienie do kierunkowych efektów uczenia się
EU1 zasady projektowania i implementacji systemów bazodanowych i hurtowni danych DS1_W06
DS1_W10
DS1_W11
EU2 różnice między systemami OLTP i OLAP oraz ich zastosowania DS1_W05
DS1_W06
EU3 pojęcia, metody integracji i zarządzania danymi związane z obszarem ETL DS1_W06
DS1_W15
DS1_W17
EU4 projektować i implementować systemy bazodanowe i hurtownie danych DS1_U04
DS1_U07
DS1_U11
EU5 analizować, budować i optymalizować zapytania SQL DS1_U07
DS1_U16
EU6 implementować procesy ETL i zapewniać jakość danych DS1_U07
DS1_U16
EU7 dbania o jakość i bezpieczeństwo danych w organizacji DS1_K03 (H1_K01)
DS1_K05
Symbol efektu uczenia się Sposób weryfikacji efektu uczenia się Forma zajęć na której zachodzi weryfikacja
EU1 egzamin pisemny W
EU2 egzamin pisemny W
EU3 egzamin pisemny W
EU4 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
EU5 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
EU6 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
EU7 ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań Ps
Bilans nakładu pracy studenta (w godzinach) Liczba godz.
Wyliczenie
1 - udziałem w wykładach 30
2 - udziałem w innych formach zajęć 30
3 - indywidualnym wsparciem merytorycznym procesu uczenia się, udziałem w zaliczeniach organizowanych poza planem zajęć 4
4 - przygotowaniem do egzaminu 16
5 - przygotowaniem do zaliczenia wykładu 10
6 - przygotowaniem do bieżących zajęć 35
RAZEM: 125
Wskaźniki ilościowe GODZINY ECTS
Nakład pracy studenta związany z zajęciami wymagającymi bezpośredniego udziału nauczyciela 64
(1)+(2)+(3)
2.6
Nakład pracy studenta związany z zajęciami o charakterze praktycznym 65
(2)+(6)
2.6
Literatura podstawowa

1. M.J. Hernandez, Projektowanie baz danych dla każdego: przewodnik krok po kroku, Helion, Gliwice, 2022
2. A. DeBarros, SQL w praktyce: jak dzięki danym uzyskiwać cenne informacje, Helion, Gliwice, 2024
3. J.L. Viescas, D.J.Steele, B.G. Clothier, Mistrzowski SQL: 61 technik pisania wydajnego kodu SQL, Helion, Gliwice, 2017
4. R.M.P. Teate, SQL dla analityków danych: tworzenie zbiorów danych dla początkujących, Helion, Gliwice, 2023
5. A. Chodkowska-Gyurics, Hurtownie danych: teoria i praktyka, Wydawnictwo Naukowe PWN, Warszawa, 2017

Literatura uzupełniająca

1. L. Campbell, C. Majors, Inżynieria niezawodnych baz danych: projektowanie systemów odpornych na błędy, Helion, Gliwice, 2018
2. J. Reis, M. Housley, Inżynieria danych w praktyce: kluczowe koncepcje i najlepsze technologie, Helion, Gliwice, 2023
3. D. Vaughan, Umiejętności analityczne w pracy z danymi i sztuczną inteligencją: wykorzystywanie najnowszych technologii w rozwijaniu przedsiębiorstwa, Helion, Gliwice, 2021

Jednostka realizująca Wydział Informatyki Data opracowania programu
Program opracował(a) dr inż. Eugenia Busłowska,dr hab. inż. Agnieszka Drużdżel,dr hab. inż. Małgorzata Krętowska 2025.03.03