Cel szkolenia

Wprowadzenie do Apache Spark jako efektywnego narzędzia służącego do przetwarzania danych.

Korzyści

Uczestnicy szkolenia poznają i zrozumieją:

  • Architekturę platformy Apache Spark
  • Środowisko programowania
  • Zasady budowania skalowalnych aplikacji
  • Budowę przepływów danych przy użyciu Apache Spark
  • Nowoczesne koncepcje adresujące wiele znanych problemów ze świata Big Data (Delta Lake)

Słuchacze będą potrafili:

  • Tworzyć aplikacje z użyciem Apache Spark
  • Tworzyć aplikacje przetwarzające duże ilości danych
Zakres szkolenia
  • Apache Spark – architektura
  • Rys historyczny
    • Architektura rozwiązania
    • Uruchamianie aplikacji
    • Monitoring
    • Rozwiązywanie problemów / debugowanie
  • Przetwarzanie danych z Apache Spark
    • RDDs, DataFrames i DataSets
    • Spark SQL
    • Joins
    • Formaty plików
    • Agregacja danych
  • Przygotowanie środowiska deweloperskiego do pracy z Apache Spark (część przeprowadzona przy użyciu języka Scala)
  • Praca z IntelliJ
    • Wprowadzenie do SBT
    • Przekazywanie parametrów / konfiguracji za pomocą zewnętrznych bibliotek
    • Testowanie kodu
  • Delta Lake – format ułatwiający przetwarzanie danych
    • Wprowadzenie do koncepcji
    • Zapisywanie / odczytywanie danych przy użyciu formatu Delta
    • Najważniejsze funkcje oraz różnice w porównaniu z klasycznymi plikami (Parquet / ORC)
Adresaci

Wszystkie osoby biorące udział w procesie tworzenia oprogramowania, członkowie zespołów projektowych.

Developerzy znający podstawy programowania, chcący poznać podstawy języka Scala niezbędne do efektywnego pisania aplikacji wykorzystujących Apache Spark.

Liczebność grupy: 8-15 uczestników

Czas trwania: 2 dni

Dostępny język: PL / EN

Dostępny język materiałów: PL / EN

Forma kursu
Prezentacja, warsztat, ćwiczenia, dyskusja. Dostępne w formule online.

Pobierz materiały

Pobierz

Dziękujemy!

Przepraszamy, coś poszło nie tak.

Odśwież stronę i spróbuj ponownie.

Przetwarzanie...

Jeśli masz pytania dotyczące naszych szkoleń,

skontaktuj się z ekspertem Sii

Agnieszka Rzeczkowska

Training Practice Manager

Skontaktuj się z ekspertem

Agnieszka Rzeczkowska

lub przeciągnij i upuść załączniki tutaj.

Dopuszczalne rozszerzenia: DOC, DOCX, PDF (max 5MB)

Dziękujemy za wypełnienie formularza.

Zapoznamy się z treścią Twojej wiadomość i skontaktujemy się z Tobą tak szybko, jak będzie to możliwe.

Przepraszamy, coś poszło nie tak i Twoja wiadomość nie została dostarczona.

Odśwież stronę i spróbuj ponownie

Przetwarzanie...

Może Cię również zainteresować

Big Data

Apache Airflow – nowoczesny sposób na orkiestrację zadań

Czas trwania:
1 dzień
Big DataChmura obliczeniowa

AWS - projektowania systemów Big Data

Czas trwania:
2 dni
Big Data

Apache Hadoop – system zorientowany na dane

Czas trwania:
2 dni
Big Data

Apache Kafka - przetwarzania danych strumieniowo

Czas trwania:
2 dni

ITIL®, PRINCE2® są zarejestrowanymi znakami handlowymi należącymi do firmy AXELOS Limited i używanymi za jej zgodą. Wszelkie prawa zastrzeżone.
AgilePM® jest zastrzeżonym znakiem towarowym Agile Business Consortium Limited. Wszelkie prawa zastrzeżone.
Kursy AgilePM® są oferowane przez Sii, spółkę stowarzyszoną z Quint Wellington Redwood, akredytowaną organizację szkoleniową The APM Group Ltd.
Lean IT® Association jest zastrzeżonym znakiem towarowym Lean IT Association LLC. Wszelkie prawa zastrzeżone.
Wszystkie ceny podane na stronie to ceny netto. Należy doliczyć podatek VAT 23%.

ZATWIERDŹ

This content is available only in one language version.
You will be redirected to home page.

Are you sure you want to leave this page?

Einige Inhalte sind nicht in deutscher Sprache verfügbar.
Sie werden dann auf die englische Sprachversion der Website weitergeleitet.

Möchten Sie fortsetzen?