Karta przedmiotu

obowiązuje studentów rozpoczynających studia w roku akademickim 2017/2018

Politechnika Krakowska im. Tadeusza Kościuszki
Wydział Fizyki, Matematyki i Informatyki
Kierunek studiów: Informatyka Profil: Ogólnoakademicki
Forma studiów: stacjonarne Kod kierunku: I
Stopień studiów: II
Specjalności: Analityka danych

1. Informacje o przedmiocie

Nazwa przedmiotu: Metody i narzędzia analizy dużych zbiorów danych
Nazwa przedmiotu w języku angielskim: Methods and tools for big data analysis
Kod przedmiotu: ………….
Kategoria przedmiotu: Przedmioty specjalnościowe
Liczba punktów: ECTS 5.00
Semestry: 2

2. Rodzaj zajęć, liczba godzin w planie studiów

Semestr: 2
Wykład: 30h
Projekt: 30h

3. Cele przedmiotu

Cel 1: Wprowadzenie podstawowych pojęć związanych z przetwarzaniem Big Data.
Cel 2: Zapoznanie słuchaczy z metodami składowania danych i z modelami danych w zastosowaniach typu Big Data
Cel 3: Utrwalenie metod eksploracji danych i wprowadzenie algorytmów eksploracji danych szczególnie użytecznych w zastosowaniach typu Big Data
Cel 4: Zapoznanie słuchaczy z narzędziami stosowanymi w zarządzani, przetwarzaniu i eksploracji danych w zastosowaniach typu Big Data.

4. Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji

Podstawowa wiedza z algebry, statystyki, metod sztucznej inteligencji, metod klasyfikacji i klasteryzacji, systemów operacyjnych, programowania.

5. Treści programowe

Wykład:

  1. Wprowadzenie do problematyki Big Data: czynniki rynkowe i biznesowe napędzające rozwój technologii Big Data.
  2. Przegląd zagadnień biznesowych wspomaganych technologiami Big Data. Integracja Big Data w aplikacjach biznesowych.
  3. Metody składowania danych w zastosowaniach typu Big Data: block-based, file-based i object-based. Modele danych: NoSQL, SQL
  4. Narzędzia wspomagające składowanie danych w zastosowaniach Big Data.
  5. Modele programowania w zastosowaniach Big Data: MapReduce, programowanie funkcyjne, języki zapytań, języki dataflow, DSL i inne.
  6. Przypomnienie algorytmów eksploracji danych ze szczególnym uwzględnieniem zastosowań typu Big Data.
  7. Przegląd platform programistycznych dla zastosowań typu Big Data.
  8. Ekosystem Hadoop: Hadoop Distrbuted File System, MapReduce, YARN, Pig, metody statystyczne w Hadoop, Oozie, Extremely Big Tables, Hive, Sqoop. Administrowanie i konfiguracja Hadoop.
  9. Big Data na chmurach obliczeniowych.
  10. Przetwarzanie strumieni danych.

Projekt: Tematyka projektów dotyczy zastosowania metod i narzędzi wprowadzonych na wykładach w implementacji aplikacji do eksploracji danych typu Big data. Projekty obejmują wybór i instalację niezbędnych narzędzi do składowania, zarządzania i eksploracji danych oraz implementację metod eksploracji danych i wizualizacji wyników.

6. Literatura

[1] Jurney R. „Zwinna analiza danych. Apache Hadoop dla każdego”, Helion 2015
[2] White T. „Hadoop. Kompletny przewodnik. Analiza i przechowywanie danych”, Helion 2015
[3] Pelikant A. „Hurtownie danych. Od przetwarzania analitycznego do raportowania”, Helion 2011
[4] Loshin D. „Big Data Analytics. From Strategic Planning to Enterprise Integration with Tools, Techniques, No_ SQL, and Graph”, Morgan Kaufmann 2013.
[5] Prajapati V. „Big data analytics with R and Hadoop”, Packt 2013.

7. Osoba odpowiedzialna za sporządzenie sylabusa

Dr hab. Zbisław Tabor, prof. PK

Załączniki:
Pobierz ten plik (Duże_Zbiory_danych.doc)Sylabus Duże Zbiory Danych[ ]31 kB