Wyślij zapytanie
Wyślij zapytanie
Wyślij zapytanie
Cel szkolenia

Wprowadzenie do Apache Spark jako efektywnego narzędzia służącego do przetwarzania danych.

Korzyści

Uczestnicy szkolenia poznają i zrozumieją:

  • Architekturę platformy Apache Spark
  • Środowisko programowania
  • Zasady budowania skalowalnych aplikacji
  • Budowę przepływów danych przy użyciu Apache Spark
  • Nowoczesne koncepcje adresujące wiele znanych problemów ze świata Big Data (Delta Lake)

Słuchacze będą potrafili:

  • Tworzyć aplikacje z użyciem Apache Spark
  • Tworzyć aplikacje przetwarzające duże ilości danych
Zakres szkolenia
  • Apache Spark – architektura
  • Rys historyczny
    • Architektura rozwiązania
    • Uruchamianie aplikacji
    • Monitoring
    • Rozwiązywanie problemów / debugowanie
  • Przetwarzanie danych z Apache Spark
    • RDDs, DataFrames i DataSets
    • Spark SQL
    • Joins
    • Formaty plików
    • Agregacja danych
  • Przygotowanie środowiska deweloperskiego do pracy z Apache Spark (część przeprowadzona przy użyciu języka Scala)
  • Praca z IntelliJ
    • Wprowadzenie do SBT
    • Przekazywanie parametrów / konfiguracji za pomocą zewnętrznych bibliotek
    • Testowanie kodu
  • Delta Lake – format ułatwiający przetwarzanie danych
    • Wprowadzenie do koncepcji
    • Zapisywanie / odczytywanie danych przy użyciu formatu Delta
    • Najważniejsze funkcje oraz różnice w porównaniu z klasycznymi plikami (Parquet / ORC)
Adresaci

Wszystkie osoby biorące udział w procesie tworzenia oprogramowania, członkowie zespołów projektowych.

Developerzy znający podstawy programowania, chcący poznać podstawy języka Scala niezbędne do efektywnego pisania aplikacji wykorzystujących Apache Spark.

Cel szkolenia

Wprowadzenie do Apache Spark jako efektywnego narzędzia służącego do przetwarzania danych.

Korzyści

Uczestnicy szkolenia poznają i zrozumieją:

  • Architekturę platformy Apache Spark
  • Środowisko programowania
  • Zasady budowania skalowalnych aplikacji
  • Budowę przepływów danych przy użyciu Apache Spark
  • Nowoczesne koncepcje adresujące wiele znanych problemów ze świata Big Data (Delta Lake)

Słuchacze będą potrafili:

  • Tworzyć aplikacje z użyciem Apache Spark
  • Tworzyć aplikacje przetwarzające duże ilości danych
Zakres szkolenia
  • Apache Spark – architektura
  • Rys historyczny
    • Architektura rozwiązania
    • Uruchamianie aplikacji
    • Monitoring
    • Rozwiązywanie problemów / debugowanie
  • Przetwarzanie danych z Apache Spark
    • RDDs, DataFrames i DataSets
    • Spark SQL
    • Joins
    • Formaty plików
    • Agregacja danych
  • Przygotowanie środowiska deweloperskiego do pracy z Apache Spark (część przeprowadzona przy użyciu języka Scala)
  • Praca z IntelliJ
    • Wprowadzenie do SBT
    • Przekazywanie parametrów / konfiguracji za pomocą zewnętrznych bibliotek
    • Testowanie kodu
  • Delta Lake – format ułatwiający przetwarzanie danych
    • Wprowadzenie do koncepcji
    • Zapisywanie / odczytywanie danych przy użyciu formatu Delta
    • Najważniejsze funkcje oraz różnice w porównaniu z klasycznymi plikami (Parquet / ORC)
Adresaci

Wszystkie osoby biorące udział w procesie tworzenia oprogramowania, członkowie zespołów projektowych.

Developerzy znający podstawy programowania, chcący poznać podstawy języka Scala niezbędne do efektywnego pisania aplikacji wykorzystujących Apache Spark.

Liczebność grupy: 8-15 uczestników

Czas trwania: 2 dni

Dostępny język: PL / EN

Dostępny język materiałów: PL / EN

Forma kursu

Szkolenie organizowane wyłącznie na zamówienie dla grup zorganizowanych (co najmniej 6-8 osób).
Prezentacja, warsztat, ćwiczenia, dyskusja. Dostępne w formule online.

Pobierz materiały

Pobierz

Dziękujemy!

Przepraszamy, coś poszło nie tak.

Odśwież stronę i spróbuj ponownie.

Błąd przesyłania pliku

Żaden plik nie został przesłany

Nieprawidłowy rozmiar pliku (maks. 5 MB)

Nieprawidłowy format pliku

Pusty plik

Przetwarzanie...

Pobierz materiały

Pobierz

Jeśli masz pytania dotyczące naszych szkoleń, skontaktuj się z ekspertami Sii

Natalia i Agata

Zespół Praktyki Szkoleniowej

Skontaktuj się z ekspertami

Natalia i Agata

Załączony plik:

  • danieltroc.pdf

Dopuszczalne pliki: DOC, DOCX, PDF (max 5MB)

Dziękujemy za wypełnienie formularza.

Zapoznamy się z treścią Twojej wiadomość i skontaktujemy się z Tobą tak szybko, jak będzie to możliwe.

Przepraszamy, coś poszło nie tak i Twoja wiadomość nie została dostarczona.

Odśwież stronę i spróbuj ponownie

Błąd przesyłania pliku

Żaden plik nie został przesłany

Nieprawidłowy rozmiar pliku (maks. 5 MB)

Nieprawidłowy format pliku

Pusty plik

Przetwarzanie...

Może Cię również zainteresować

Big Data

Apache Hadoop – system zorientowany na dane

Czas trwania:
2 dni
Big Data

Apache Kafka - przetwarzania danych strumieniowo

Czas trwania:
2 dni
Big DataAWS

AWS - projektowania systemów Big Data

Czas trwania:
2 dni

ITIL®, PRINCE2® są zarejestrowanymi znakami handlowymi należącymi do firmy AXELOS Limited i używanymi za jej zgodą. Wszelkie prawa zastrzeżone.
AgilePM® jest zastrzeżonym znakiem towarowym Agile Business Consortium Limited. Wszelkie prawa zastrzeżone.
Kursy AgilePM® są oferowane przez Sii, spółkę stowarzyszoną z Quint Wellington Redwood, akredytowaną organizację szkoleniową The APM Group Ltd.
Lean IT® Association jest zastrzeżonym znakiem towarowym Lean IT Association LLC. Wszelkie prawa zastrzeżone.
SIAM™ jest zastrzeżonym znakiem towarowym EXIN Holding B.V.
Wszystkie ceny podane na stronie to ceny netto. Należy doliczyć podatek VAT 23%.

ZATWIERDŹ

This content is available only in one language version.
You will be redirected to home page.

Are you sure you want to leave this page?

Einige Inhalte sind nicht in deutscher Sprache verfügbar.
Sie werden auf die deutsche Homepage weitergeleitet.

Möchten Sie fortsetzen?