Cel szkolenia

Wprowadzenie do przetwarzania danych na platformie Apache Hadoop – Cloudera z wykorzystaniem frameworków Apache Hive, Impala, Sqoop i bazy danych HBase

Korzyści

Uczestnicy szkolenia poznają i zrozumieją:

  • Praktyczne podejście do przetwarzania danych na platformie Apache Hadoop
  • Architekturę platformy Apache Hadoop
  • Środowisko pracy
  • Pracę z danymi
  • Przypadki użycia w świecie rzeczywistym

Słuchacze będą potrafili :

  • Tworzyć zadania przetwarzania danych
  • Tworzyć systemy zorientowane na dane
Zakres szkolenia
  • Big Data w inżynierii danych
  • Rys historyczny – podstawowe koncepcje
    • Apache Hadoop – omówienie teoretyczne
    • Koncepcje architektoniczne wykorzystywane w rozwiązaniach on-premise
    • Kluczowi gracze oraz technologie
  •  Apache Hive
    • Definicje, operacje i agregacja danych
    • Wydajność i optymalizacja
  • Apache Impala
    • Kluczowe elementy
    • Język zapytań
    • Wydajność
    • Integracja z innymi frameworkami
  • Apache HBase
    • NoSQL
    • Definicja schematu
    • Typy danych
    • Operacje i skany
    • Filtry i liczniki
    • Projektowanie kluczy
    • Klienci frameworków
  • Apache Sqoop
    • Importowanie i eksportowanie danych
    • Integracja z ekosystemem Hadoop
  • Projekt / ćwiczenia
    • Budowanie całościowego rozwiązania w celu integracji powyższych platform
Wymagania wstępne

Przydatne, ale niekonieczne jest doświadczenie w testowaniu oprogramowania.

Adresaci

Wszystkie osoby zaangażowane w przetwarzanie danych w bazach danych, hurtowniach danych lub BI. Inżynierowie, którzy codziennie pracują z różnymi źródłami danych i różnymi formatami danych.

Liczebność grupy: 8-15 uczestników

Czas trwania: 2 dni

Dostępny język: PL / EN

Dostępny język materiałów: PL / EN

Forma kursu
Prezentacja, warsztat, ćwiczenia, dyskusja. Dostępne w formule online.

Pobierz materiały

Pobierz

Dziękujemy!

Przepraszamy, coś poszło nie tak.

Odśwież stronę i spróbuj ponownie.

Przetwarzanie...

Jeśli masz pytania dotyczące naszych szkoleń,

skontaktuj się z ekspertem Sii

Agnieszka Rzeczkowska

Training Practice Manager

Skontaktuj się z ekspertem

Agnieszka Rzeczkowska

lub przeciągnij i upuść załączniki tutaj.

Dopuszczalne rozszerzenia: DOC, DOCX, PDF (max 5MB)

Dziękujemy za wypełnienie formularza.

Zapoznamy się z treścią Twojej wiadomość i skontaktujemy się z Tobą tak szybko, jak będzie to możliwe.

Przepraszamy, coś poszło nie tak i Twoja wiadomość nie została dostarczona.

Odśwież stronę i spróbuj ponownie

Przetwarzanie...

Może Cię również zainteresować

Big Data

Apache Kafka - przetwarzania danych strumieniowo

Czas trwania:
2 dni
Big Data

Apache Spark - budowanie systemów do przetwarzania danych w czasie rzeczywistym

Czas trwania:
2 dni
Big Data

Apache Airflow – nowoczesny sposób na orkiestrację zadań

Czas trwania:
1 dzień
Big DataChmura obliczeniowa

AWS - projektowania systemów Big Data

Czas trwania:
2 dni

ITIL®, PRINCE2® są zarejestrowanymi znakami handlowymi należącymi do firmy AXELOS Limited i używanymi za jej zgodą. Wszelkie prawa zastrzeżone.
AgilePM® jest zastrzeżonym znakiem towarowym Agile Business Consortium Limited. Wszelkie prawa zastrzeżone.
Kursy AgilePM® są oferowane przez Sii, spółkę stowarzyszoną z Quint Wellington Redwood, akredytowaną organizację szkoleniową The APM Group Ltd.
Lean IT® Association jest zastrzeżonym znakiem towarowym Lean IT Association LLC. Wszelkie prawa zastrzeżone.
Wszystkie ceny podane na stronie to ceny netto. Należy doliczyć podatek VAT 23%.

ZATWIERDŹ

This content is available only in one language version.
You will be redirected to home page.

Are you sure you want to leave this page?

Einige Inhalte sind nicht in deutscher Sprache verfügbar.
Sie werden dann auf die englische Sprachversion der Website weitergeleitet.

Möchten Sie fortsetzen?