Analityka Big Data Open Source

Autor: Laura McKinney
Data Utworzenia: 1 Kwiecień 2021
Data Aktualizacji: 14 Móc 2024
Anonim
JAK MIEĆ LEPSZĄ PRACĘ ❓❓ Analiza danych i rozwój zawodowy 💲 WYWIAD Kajo Rudziński vs Emil Kos
Wideo: JAK MIEĆ LEPSZĄ PRACĘ ❓❓ Analiza danych i rozwój zawodowy 💲 WYWIAD Kajo Rudziński vs Emil Kos

Zawartość

Definicja - Co oznacza Open Big Source Analytics?

Analizy dużych zbiorów danych typu open source odnoszą się do korzystania z oprogramowania i narzędzi typu open source do analizowania ogromnych ilości danych w celu gromadzenia istotnych i przydatnych informacji, które organizacja może wykorzystać do realizacji swoich celów biznesowych. Największym graczem w analizie dużych zbiorów danych typu open source jest Apaches Hadoop - jest to najczęściej używana biblioteka oprogramowania do przetwarzania ogromnych zbiorów danych w klastrze komputerów przy użyciu rozproszonego procesu równoległości.


Wprowadzenie do Microsoft Azure i Microsoft Cloud | W tym przewodniku dowiesz się, na czym polega przetwarzanie w chmurze i jak Microsoft Azure może pomóc w migracji i prowadzeniu firmy z chmury.

Techopedia wyjaśnia Open-Source Big Data Analytics

Analityka dużych zbiorów danych open source korzysta z oprogramowania i narzędzi open source w celu wykonania analizy danych big data przy użyciu całej platformy oprogramowania lub różnych narzędzi open source do różnych zadań w procesie analizy danych. Apache Hadoop jest najbardziej znanym systemem do analizy dużych zbiorów danych, ale inne komponenty są wymagane przed złożeniem prawdziwego systemu analitycznego.

Hadoop to implementacja algorytmu MapReduce o otwartym kodzie źródłowym, zapoczątkowana przez Google i Yahoo, dlatego stanowi podstawę większości dzisiejszych systemów analitycznych. Wiele narzędzi do analizy dużych zbiorów danych wykorzystuje otwarte źródła, w tym solidne systemy baz danych, takie jak open source MongoDB, wyrafinowana i skalowalna baza danych NoSQL, bardzo odpowiednia dla aplikacji dużych zbiorów danych, a także innych.


Usługi analityki dużych zbiorów danych typu open source obejmują:

  • System gromadzenia danych
  • Centrum sterowania do administrowania i monitorowania klastrów
  • Biblioteka uczenia maszynowego i eksploracji danych
  • Usługa koordynacji aplikacji
  • Silnik obliczeniowy
  • Ramy wykonania