Wyślij zapytanie
Wyślij zapytanie
Wyślij zapytanie
Cel szkolenia

Wprowadzenie do przetwarzania danych na platformie Apache Hadoop – Cloudera z wykorzystaniem frameworków Apache Hive, Impala, Sqoop i bazy danych HBase

Korzyści

Uczestnicy szkolenia poznają i zrozumieją:

  • Praktyczne podejście do przetwarzania danych na platformie Apache Hadoop
  • Architekturę platformy Apache Hadoop
  • Środowisko pracy
  • Pracę z danymi
  • Przypadki użycia w świecie rzeczywistym

Słuchacze będą potrafili :

  • Tworzyć zadania przetwarzania danych
  • Tworzyć systemy zorientowane na dane
Zakres szkolenia
  • Big Data w inżynierii danych
  • Rys historyczny – podstawowe koncepcje
    • Apache Hadoop – omówienie teoretyczne
    • Koncepcje architektoniczne wykorzystywane w rozwiązaniach on-premise
    • Kluczowi gracze oraz technologie
  •  Apache Hive
    • Definicje, operacje i agregacja danych
    • Wydajność i optymalizacja
  • Apache Impala
    • Kluczowe elementy
    • Język zapytań
    • Wydajność
    • Integracja z innymi frameworkami
  • Apache HBase
    • NoSQL
    • Definicja schematu
    • Typy danych
    • Operacje i skany
    • Filtry i liczniki
    • Projektowanie kluczy
    • Klienci frameworków
  • Apache Sqoop
    • Importowanie i eksportowanie danych
    • Integracja z ekosystemem Hadoop
  • Projekt / ćwiczenia
    • Budowanie całościowego rozwiązania w celu integracji powyższych platform
Wymagania wstępne

Przydatne, ale niekonieczne jest doświadczenie w testowaniu oprogramowania.

Adresaci

Wszystkie osoby zaangażowane w przetwarzanie danych w bazach danych, hurtowniach danych lub BI. Inżynierowie, którzy codziennie pracują z różnymi źródłami danych i różnymi formatami danych.

Cel szkolenia

Wprowadzenie do przetwarzania danych na platformie Apache Hadoop – Cloudera z wykorzystaniem frameworków Apache Hive, Impala, Sqoop i bazy danych HBase

Korzyści

Uczestnicy szkolenia poznają i zrozumieją:

  • Praktyczne podejście do przetwarzania danych na platformie Apache Hadoop
  • Architekturę platformy Apache Hadoop
  • Środowisko pracy
  • Pracę z danymi
  • Przypadki użycia w świecie rzeczywistym

Słuchacze będą potrafili :

  • Tworzyć zadania przetwarzania danych
  • Tworzyć systemy zorientowane na dane
Zakres szkolenia
  • Big Data w inżynierii danych
  • Rys historyczny – podstawowe koncepcje
    • Apache Hadoop – omówienie teoretyczne
    • Koncepcje architektoniczne wykorzystywane w rozwiązaniach on-premise
    • Kluczowi gracze oraz technologie
  •  Apache Hive
    • Definicje, operacje i agregacja danych
    • Wydajność i optymalizacja
  • Apache Impala
    • Kluczowe elementy
    • Język zapytań
    • Wydajność
    • Integracja z innymi frameworkami
  • Apache HBase
    • NoSQL
    • Definicja schematu
    • Typy danych
    • Operacje i skany
    • Filtry i liczniki
    • Projektowanie kluczy
    • Klienci frameworków
  • Apache Sqoop
    • Importowanie i eksportowanie danych
    • Integracja z ekosystemem Hadoop
  • Projekt / ćwiczenia
    • Budowanie całościowego rozwiązania w celu integracji powyższych platform
Wymagania wstępne

Przydatne, ale niekonieczne jest doświadczenie w testowaniu oprogramowania.

Adresaci

Wszystkie osoby zaangażowane w przetwarzanie danych w bazach danych, hurtowniach danych lub BI. Inżynierowie, którzy codziennie pracują z różnymi źródłami danych i różnymi formatami danych.

Liczebność grupy: 8-15 uczestników

Czas trwania: 2 dni

Dostępny język: PL / EN

Dostępny język materiałów: PL / EN

Forma kursu

Szkolenie organizowane wyłącznie na zamówienie dla grup zorganizowanych (co najmniej 6-8 osób).
Prezentacja, warsztat, ćwiczenia, dyskusja. Dostępne w formule online.

Pobierz materiały

Pobierz

Dziękujemy!

Przepraszamy, coś poszło nie tak.

Odśwież stronę i spróbuj ponownie.

Błąd przesyłania pliku

Żaden plik nie został przesłany

Nieprawidłowy rozmiar pliku (maks. 5 MB)

Nieprawidłowy format pliku

Pusty plik

Przetwarzanie...

Pobierz materiały

Pobierz

Jeśli masz pytania dotyczące naszych szkoleń, skontaktuj się z ekspertami Sii

Natalia i Agata

Zespół Praktyki Szkoleniowej

Skontaktuj się z ekspertami

Natalia i Agata

Załączony plik:

  • danieltroc.pdf

Dopuszczalne pliki: DOC, DOCX, PDF (max 5MB)

Dziękujemy za wypełnienie formularza.

Zapoznamy się z treścią Twojej wiadomość i skontaktujemy się z Tobą tak szybko, jak będzie to możliwe.

Przepraszamy, coś poszło nie tak i Twoja wiadomość nie została dostarczona.

Odśwież stronę i spróbuj ponownie

Błąd przesyłania pliku

Żaden plik nie został przesłany

Nieprawidłowy rozmiar pliku (maks. 5 MB)

Nieprawidłowy format pliku

Pusty plik

Przetwarzanie...

Może Cię również zainteresować

Big Data

Apache Kafka - przetwarzania danych strumieniowo

Czas trwania:
2 dni
Big DataAWS

AWS - projektowania systemów Big Data

Czas trwania:
2 dni
Big Data

Apache Spark - budowanie systemów do przetwarzania danych w czasie rzeczywistym

Czas trwania:
2 dni

ITIL®, PRINCE2® są zarejestrowanymi znakami handlowymi należącymi do firmy AXELOS Limited i używanymi za jej zgodą. Wszelkie prawa zastrzeżone.
AgilePM® jest zastrzeżonym znakiem towarowym Agile Business Consortium Limited. Wszelkie prawa zastrzeżone.
Kursy AgilePM® są oferowane przez Sii, spółkę stowarzyszoną z Quint Wellington Redwood, akredytowaną organizację szkoleniową The APM Group Ltd.
Lean IT® Association jest zastrzeżonym znakiem towarowym Lean IT Association LLC. Wszelkie prawa zastrzeżone.
SIAM™ jest zastrzeżonym znakiem towarowym EXIN Holding B.V.
Wszystkie ceny podane na stronie to ceny netto. Należy doliczyć podatek VAT 23%.

ZATWIERDŹ

This content is available only in one language version.
You will be redirected to home page.

Are you sure you want to leave this page?

Einige Inhalte sind nicht in deutscher Sprache verfügbar.
Sie werden auf die deutsche Homepage weitergeleitet.

Möchten Sie fortsetzen?