Karta Przedmiotu
| Politechnika Białostocka | Wydział Informatyki | ||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Kierunek studiów | Data Science |
Poziom i forma studiów |
pierwszego stopnia stacjonarne |
||||||||||||||||||||||||
| Grupa przedmiotów / specjalność |
Profil kształcenia | ogólnoakademicki | |||||||||||||||||||||||||
| Nazwa przedmiotu | Bazy i hurtownie danych | E | Kod przedmiotu | DS1S2BHD | |||||||||||||||||||||||
| Rodzaj zajęć | obowiązkowy | ||||||||||||||||||||||||||
| Formy zajęć i liczba godzin | W | Ć | L | P | Ps | T | S | Semestr | 2 | ||||||||||||||||||
| 30 | 30 | Punkty ECTS | 5 | ||||||||||||||||||||||||
| Program obowiązuje od | 2025/2026 | ||||||||||||||||||||||||||
| Przedmioty wprowadzające | Wstęp do Data Science (DS1S1WDS), | ||||||||||||||||||||||||||
| Cele przedmiotu |
Przekazanie kompleksowej wiedzy z zakresu projektowania, implementacji i zarządzania bazami oraz hurtowniami danych, z uwzględnieniem specyfiki systemów analitycznych. Rozwój praktycznych umiejętności w zakresie modelowania danych, implementacji systemów bazodanowych i tworzenia rozwiązań, które są podstawą systemów Business Intelligence. Odniesienia do frameworka edukacyjnego mikrokompetencji SFIA: Database Design DBDS - poziom 3 Data Management DATM - poziom 3 Data Engineering DENG - poziom 3 Data Modelling and Design DTAN - poziom 3 |
||||||||||||||||||||||||||
| Ramowe treści programowe | Wprowadzenie do systemów baz danych i hurtowni danych, ich architektury oraz różnic między rozwiązaniami OLTP i OLAP. Modelowanie danych w kontekście relacyjnym i wymiarowym, wykorzystanie SQL oraz zaawansowanych zapytań analitycznych. Procesy integracji i przetwarzania danych (ETL) oraz ich automatyzacja. Przegląd platform bazodanowych, zarządzanie metadanymi i jakością danych. Nowoczesne architektury danych, w tym systemy NoSQL i data lake. Aspekty bezpieczeństwa i wydajności systemów bazodanowych. Projektowanie, implementacja i optymalizacja baz danych oraz hurtowni danych, w tym modelowanie wymiarowe i integracja danych. Praca z różnymi systemami bazodanowymi, zarządzanie jakością i bezpieczeństwem danych. | ||||||||||||||||||||||||||
| Inne informacje o przedmiocie | przedmiot ma związek z prowadzoną na Uczelni działalnością naukową | ||||||||||||||||||||||||||
| Wyliczenie: | Nakład pracy studenta związany z: | Godzin ogółem |
W tym kontaktowych |
W tym praktycznych |
|||||||||||||||||||||||
| udziałem w wykładach | 30 | 30 | |||||||||||||||||||||||||
| udziałem w innych formach zajęć | 30 | 30 | 30 | ||||||||||||||||||||||||
| indywidualnym wsparciem merytorycznym procesu uczenia się, udziałem w zaliczeniach organizowanych poza planem zajęć | 4 | 4 | |||||||||||||||||||||||||
| przygotowaniem do egzaminu | 16 | ||||||||||||||||||||||||||
| przygotowaniem do zaliczenia wykładu | 10 | ||||||||||||||||||||||||||
| przygotowaniem do bieżących zajęć | 35 | 35 | |||||||||||||||||||||||||
| Razem godzin: | 125 | 64 | 65 | ||||||||||||||||||||||||
| Razem punktów ECTS: | 5 | 2.6 | 2.6 | ||||||||||||||||||||||||
| Zakładane kierunkowe efekty uczenia się | Wiedza | Umiejętności | Kompetencje społeczne |
||||||||||||||||||||||||
| DS1_W05 | DS1_U04 | DS1_K03 (H1_K01) | |||||||||||||||||||||||||
| DS1_W06 | DS1_U07 | DS1_K05 | |||||||||||||||||||||||||
| DS1_W10 | DS1_U11 | ||||||||||||||||||||||||||
| DS1_W11 | DS1_U16 | ||||||||||||||||||||||||||
| DS1_W15 | |||||||||||||||||||||||||||
| DS1_W17 | |||||||||||||||||||||||||||
| Cele i treści ramowe sformułował(a) | dr inż. Eugenia Busłowska, dr hab. inż. Agnieszka Drużdżel, dr inż. Paweł Tadejko | Data: | 29/05/2025 | ||||||||||||||||||||||||
| Realizacja w roku akademickim | 2025/2026 | ||||||||||||||||||||||||||
| Treści programowe | |||||||||||||||||||||||||||
| Wykład | |||||||||||||||||||||||||||
| 1. | Wprowadzenie do systemów bazodanowych. Architektura systemów OLTP i OLAP | ||||||||||||||||||||||||||
| 2. | Porównanie różnych podejść do przechowywania i przetwarzania danych | ||||||||||||||||||||||||||
| 3. | Modelowanie relacyjne. Projektowanie schematów baz danych, normalizacja i denormalizacja. Modelowanie związków między encjami w kontekście analitycznym | ||||||||||||||||||||||||||
| 4. | Język SQL. Zapytania analityczne, funkcje okienkowe, procedury składowane. Zapytania złożone. Podzapytania | ||||||||||||||||||||||||||
| 5. | Optymalizacja zapytań w kontekście dużych zbiorów danych | ||||||||||||||||||||||||||
| 6. | Hurtownie danych. Architektura i komponenty hurtowni danych. Koncepcja hurtowni danych w porównaniu z systemami opartymi na relacyjnym modelu | ||||||||||||||||||||||||||
| 7. | Koncepcja kostki danych. Wymiary i fakty. Modelowanie wymiarowe i schematy gwiaździste | ||||||||||||||||||||||||||
| 8. | Procesy ETL. Projektowanie i implementacja procesów ekstrakcji, transformacji i ładowania danych | ||||||||||||||||||||||||||
| 9. | Architektura systemów ładowania danych. Warstwy pośrednie i ich rola. ETL kontra ELT we współczesnych hurtowniach. Zapewnienie jakości danych | ||||||||||||||||||||||||||
| 10. | Narzędzia DBMS oraz zarządzanie metadanymi, jakością danych i bezpieczeństwem w kontekście Data Governance, bezpieczeństwa i zgodności z regulacjami | ||||||||||||||||||||||||||
| 11. | Systemy NoSQL. Bazy dokumentowe, grafowe i kolumnowe. Wybór odpowiedniej technologii dla różnych przypadków użycia | ||||||||||||||||||||||||||
| 12. | Systemy NoSQL. Bazy dokumentowe, grafowe i kolumnowe. Wybór odpowiedniej technologii dla różnych przypadków użycia | ||||||||||||||||||||||||||
| 13. | Koncepcja Data Lake i Modern Data Stack. Architektura nowoczesnych rozwiązań do przechowywania i analizy danych Business Intelligence | ||||||||||||||||||||||||||
| 14. | Koncepcja Data Lake i Modern Data Stack. Architektura nowoczesnych rozwiązań do przechowywania i analizy danych Business Intelligence | ||||||||||||||||||||||||||
| 15. | Integracja różnych źródeł danych | ||||||||||||||||||||||||||
| Pracownia specjalistyczna | |||||||||||||||||||||||||||
| 1. | Projektowanie baz danych: modelowanie relacyjne; implementacja schematów; optymalizacja struktur danych | ||||||||||||||||||||||||||
| 2. | Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań | ||||||||||||||||||||||||||
| 3. | Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań | ||||||||||||||||||||||||||
| 4. | Implementacja zapytań analitycznych: zaawansowany SQL; analiza wydajności; optymalizacja zapytań | ||||||||||||||||||||||||||
| 5. | Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych | ||||||||||||||||||||||||||
| 6. | Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych | ||||||||||||||||||||||||||
| 7. | Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych | ||||||||||||||||||||||||||
| 8. | Projektowanie hurtowni danych: modelowanie wymiarowe; implementacja schematów; integracja źródeł danych | ||||||||||||||||||||||||||
| 9. | Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów | ||||||||||||||||||||||||||
| 10. | Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów | ||||||||||||||||||||||||||
| 11. | Procesy ETL: implementacja pipeline'ów ETL. Zapewnienie jakości danych. Automatyzacja procesów | ||||||||||||||||||||||||||
| 12. | Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi | ||||||||||||||||||||||||||
| 13. | Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi | ||||||||||||||||||||||||||
| 14. | Systemy NoSQL: praca z różnymi typami baz NoSQL. Implementacja przypadków użycia; integracja z systemami analitycznymi | ||||||||||||||||||||||||||
| 15. | Zaliczenie pracowni specjalistycznej | ||||||||||||||||||||||||||
| Metody dydaktyczne (realizacja stacjonarna) |
|||||||||||||||||||||||||||
| W | wykład problemowy; wykład konwersatoryjny; wykład z prezentacją multimedialną | ||||||||||||||||||||||||||
| Ps | zadania projektowe w grupach; dyskusja rozwiązań | ||||||||||||||||||||||||||
| Metody dydaktyczne (realizacja zdalna) |
|||||||||||||||||||||||||||
| W | wykład problemowy; wykład konwersatoryjny; wykład z prezentacją multimedialną | ||||||||||||||||||||||||||
| - | |||||||||||||||||||||||||||
| Forma zaliczenia | |||||||||||||||||||||||||||
| W | egzamin pisemny z pytaniami otwartymi | ||||||||||||||||||||||||||
| Ps | opracowanie zadań projektowych realizowanych w grupach | ||||||||||||||||||||||||||
| Warunki zaliczenia | |||||||||||||||||||||||||||
| W | Uzyskanie min. 30% z każdego E1-E3, a po spełnieniu tego warunku ostateczna ocena wynika z sumy uzyskanych punktów. Kryteria oceny: [ 0 – 50]% punktów – 2.0 (50 – 60]% punktów – 3.0 (60 – 70]% punktów – 3.5 (70 – 80]% punktów – 4.0 (80 – 90]% punktów – 4.5 (90 – 100]% punktów – 5.0 |
||||||||||||||||||||||||||
| Ps | Uzyskanie min. 30% z każdego E4-E7, a po spełnieniu tego warunku ostateczna ocena wynika z sumy uzyskanych punktów. Kryteria oceny: [ 0 – 50]% punktów – 2.0 (50 – 60]% punktów – 3.0 (60 – 70]% punktów – 3.5 (70 – 80]% punktów – 4.0 (80 – 90]% punktów – 4.5 (90 – 100]% punktów – 5.0 |
||||||||||||||||||||||||||
| Symbol efektu | Zakładane efekty uczenia się | Odniesienie do efektów uczenia się zdefiniowanych dla kierunku studiów | |||||||||||||||||||||||||
| Wiedza | Umiejętności | Kompetencje społeczne |
|||||||||||||||||||||||||
| Wiedza: student zna i rozumie | |||||||||||||||||||||||||||
| E1 | zasady projektowania i implementacji systemów bazodanowych i hurtowni danych | ||||||||||||||||||||||||||
| E2 | różnice między systemami OLTP i OLAP oraz ich zastosowania | ||||||||||||||||||||||||||
| E3 | pojęcia, metody integracji i zarządzania danymi związane z obszarem ETL | ||||||||||||||||||||||||||
| Umiejętności: student potrafi | |||||||||||||||||||||||||||
| E4 | projektować i implementować systemy bazodanowe i hurtownie danych | ||||||||||||||||||||||||||
| E5 | analizować, budować i optymalizować zapytania SQL | ||||||||||||||||||||||||||
| E6 | implementować procesy ETL i zapewniać jakość danych | ||||||||||||||||||||||||||
| Kompetencje społeczne: student jest gotów do | |||||||||||||||||||||||||||
| E7 | dbania o jakość i bezpieczeństwo danych w organizacji | ||||||||||||||||||||||||||
| Symbol efektu | Sposób weryfikacji efektu uczenia się | Forma zajęć na której zachodzi weryfikacja | |||||||||||||||||||||||||
| E1 | egzamin pisemny | W | |||||||||||||||||||||||||
| E2 | egzamin pisemny | W | |||||||||||||||||||||||||
| E3 | egzamin pisemny | W | |||||||||||||||||||||||||
| E4 | ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań | Ps | |||||||||||||||||||||||||
| E5 | ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań | Ps | |||||||||||||||||||||||||
| E6 | ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań | Ps | |||||||||||||||||||||||||
| E7 | ocena sprawozdań laboratoryjnych oraz rozwiązywanych zadań | Ps | |||||||||||||||||||||||||
| Literatura podstawowa | |||||||||||||||||||||||||||
| 1. | M.J. Hernandez, Projektowanie baz danych dla każdego: przewodnik krok po kroku, Helion, Gliwice, 2022 | ||||||||||||||||||||||||||
| 2. | A. DeBarros, SQL w praktyce: jak dzięki danym uzyskiwać cenne informacje, Helion, Gliwice, 2024 | ||||||||||||||||||||||||||
| 3. | J.L. Viescas, D.J.Steele, B.G. Clothier, Mistrzowski SQL: 61 technik pisania wydajnego kodu SQL, Helion, Gliwice, 2017 | ||||||||||||||||||||||||||
| 4. | R.M.P. Teate, SQL dla analityków danych: tworzenie zbiorów danych dla początkujących, Helion, Gliwice, 2023 | ||||||||||||||||||||||||||
| 5. | A. Chodkowska-Gyurics, Hurtownie danych: teoria i praktyka, Wydawnictwo Naukowe PWN, Warszawa, 2017 | ||||||||||||||||||||||||||
| Literatura uzupełniająca | |||||||||||||||||||||||||||
| 1. | L. Campbell, C. Majors, Inżynieria niezawodnych baz danych: projektowanie systemów odpornych na błędy, Helion, Gliwice, 2018 | ||||||||||||||||||||||||||
| 2. | J. Reis, M. Housley, Inżynieria danych w praktyce: kluczowe koncepcje i najlepsze technologie, Helion, Gliwice, 2023 | ||||||||||||||||||||||||||
| 3. | D. Vaughan, Umiejętności analityczne w pracy z danymi i sztuczną inteligencją: wykorzystywanie najnowszych technologii w rozwijaniu przedsiębiorstwa, Helion, Gliwice, 2021 | ||||||||||||||||||||||||||
| Koordynator przedmiotu: | dr inż. Eugenia Busłowska, dr hab. inż. Agnieszka Drużdżel, dr hab. inż. Małgorzata Krętowska | Data: | 03/03/2025 | ||||||||||||||||||||||||