SQL na Hadoop

Autor: Roger Morrison
Data Utworzenia: 19 Wrzesień 2021
Data Aktualizacji: 21 Czerwiec 2024
Anonim
Query Data in Hadoop Using ANSI SQL
Wideo: Query Data in Hadoop Using ANSI SQL

Zawartość

Definicja - Co oznacza SQL na Hadoop?

SQL na Hadoop jest rodzajem narzędzia analitycznego - implementacja SQL na platformie Hadoop, która łączy standardowe zapytania strukturalne w stylu SQL ze strukturą danych Hadoop. Hadoop jest stosunkowo nową platformą, podobnie jak same duże zbiory danych, i niewielu specjalistów jest w tym ekspertami, ale SQL na Hadoop upraszcza dostęp do frameworka Hadoop i ułatwia wdrażanie w obecnych systemach korporacyjnych.


Wprowadzenie do Microsoft Azure i Microsoft Cloud | W tym przewodniku dowiesz się, na czym polega przetwarzanie w chmurze i jak Microsoft Azure może pomóc w migracji i prowadzeniu firmy z chmury.

Techopedia wyjaśnia SQL na Hadoop

SQL na Hadoop odnosi się do różnych implementacji SQL dla platformy Hadoop. MapReduce, który jest maperem zadań klastra Hadoops i organizatorem wyników, obsługuje SQL jako główny przypadek użycia, a także inne metody przetwarzania. Dlatego sensowne jest tworzenie potężnych narzędzi do obsługi SQL, który jest jednym z najczęściej używanych języków do zapytań i manipulacji w bazie danych. Ponieważ Hadoop zyskuje popularność w architekturze danych korporacyjnych, SQL jest kluczem do właściwego przyjęcia zarówno luźno ustrukturyzowanych danych, jak i danych strukturalnych używanych w Hadoop.

SQL na kluczowych sterownikach Hadoop obejmują:

  • Wykorzystanie istniejących umiejętności SQL obecnych w większości organizacji
  • Ponowne wykorzystanie inwestycji w transformację ekstrakcyjną (ETL), analizy biznesowej (BI) i infrastruktury infrastruktury analitycznej w Hadoop

Niektóre implementacje SQL w Hadoop obejmują:


  • Apache Spark SQL
  • Apache Hive
  • Apache Tajo
  • Wiertarka Apache
  • HP Vertica na MapR
  • Sterowniki ODBC
  • Presto
  • Rekin