Nauka danych czy uczenie maszynowe? Oto jak rozpoznać różnicę

Zawartość

Nauka danych i uczenie maszynowe: szeroka i wąska terminologia
Zestawy umiejętności analizy danych i uczenia maszynowego
Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia
Jak rozpoznać uczenie maszynowe
Dwie najnowocześniejsze dyscypliny

Źródło: Elnur / Dreamstime.com

Na wynos:

Nauka danych i uczenie maszynowe różnią się w kluczowych aspektach. Pod pewnymi względami jeden może być postrzegany jako podzbiór drugiego. Oba są ważne w bieżącym postępie IT.

W tym nowym świecie sztucznej inteligencji i zarządzania danymi łatwo jest się pomylić z niektórymi terminami najczęściej używanymi w świecie IT.

Na przykład nauka danych i uczenie maszynowe mają ze sobą wiele wspólnego. Nic dziwnego, że wiele osób z niewielką wiedzą na temat tych dyscyplin miałoby problem z ustaleniem, czym się różnią.

Oto najlepszy sposób na oddzielenie nauki o danych od uczenia maszynowego jako zasady i podejścia technologicznego.

Nauka danych i uczenie maszynowe: szeroka i wąska terminologia

Po pierwsze, analiza danych jest naprawdę szeroką, nadrzędną kategorią technologii, która obejmuje wiele różnych rodzajów projektów i kreacji. (Aby uzyskać więcej informacji na temat zadań związanych z analizą danych, zobacz Job Role: Data Scientist.)

Analiza danych jest zasadniczo praktyką pracy z dużymi zbiorami danych. Okazało się, że prawo Moore'a i rozpowszechnianie się bardziej wydajnych urządzeń pamięci masowej doprowadziło do gromadzenia ogromnych ilości danych przez firmy i inne podmioty. Następnie platformy Big Data i narzędzia takie jak Hadoop zaczęły na nowo definiować obliczenia, zmieniając sposób zarządzania danymi. Teraz, dzięki chmurze i konteneryzacji, a także zupełnie nowym modelom, duże zbiory danych stały się głównym motorem naszego stylu życia i pracy.

W najprostszej formie, nauka danych to sposób, w jaki zarządzamy tymi danymi, od czyszczenia i udoskonalania ich do wykorzystania w formie wglądu.

Definicja uczenia maszynowego jest znacznie węższa. W uczeniu maszynowym technologie pobierają dane i przeprowadzają je przez algorytmy, aby symulować ludzkie procesy poznawcze określane jako „uczenie się”. Innymi słowy, po zebraniu danych i przeszkoleniu na nich komputer jest w stanie zapewnić własne wyniki , gdzie wydaje się, że technologia nauczyła się na podstawie procesów wdrożonych przez programistów.

Zestawy umiejętności analizy danych i uczenia maszynowego

Innym sposobem na przeciwstawienie nauki danych i uczenia maszynowego jest przyjrzenie się różnym umiejętnościom, które są najbardziej cenne dla specjalistów w każdej z tych dziedzin.

Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia

Nie możesz poprawić swoich umiejętności programistycznych, gdy nikt nie dba o jakość oprogramowania.

Istnieje ogólna zgoda, że naukowcy korzystający z danych korzystają z głębokich umiejętności analitycznych i matematycznych, praktycznego doświadczenia z technologiami baz danych oraz znajomości języków programowania, takich jak Python lub inne pakiety używane do analizowania dużych zbiorów danych.

„Każdy, kto jest zainteresowany budowaniem silnej kariery w (informatyce), powinien zdobyć kluczowe umiejętności w trzech działach: analityki, programowania i wiedzy w dziedzinie”, pisze Srihari Sasikumar z Simplilearn. „Idąc o jeden poziom głębiej, następujące umiejętności pomogą ci stworzyć niszę jako naukowiec danych: silna znajomość Python, SAS, R (i) Scala, praktyczne doświadczenie w kodowaniu baz danych SQL, umiejętność pracy z nieuporządkowanymi danymi z różne źródła, takie jak wideo i media społecznościowe, rozumieją wiele funkcji analitycznych (i) wiedzę na temat uczenia maszynowego. ”

Po stronie uczenia maszynowego eksperci często wymieniają umiejętności modelowania danych, wiedzę na temat prawdopodobieństwa i statystyki oraz szersze umiejętności programowania jako pomocne narzędzia w zestawie narzędzi dla inżyniera uczenia maszynowego.

Jak rozpoznać uczenie maszynowe

Kluczem tutaj jest to, że wszelkiego rodzaju rzeczy obejmują prace związane z nauką danych, ale nie są to uczenie maszynowe, chyba że masz bardzo rygorystyczny program, który pomaga komputerowi uczyć się na podstawie jego danych wejściowych.

Kiedy to jest na miejscu, tworzy zaskakująco sprawne systemy, które mogą mieć szeroki wpływ na nasze życie.

„Wiele z tego, co robimy z uczeniem maszynowym, dzieje się pod powierzchnią” - powiedział podobno założyciel Amazon, Jeff Bezos, wskazując niektóre zastosowania tego typu systemów. „Uczenie maszynowe napędza nasze algorytmy prognozowania popytu, rankingu wyszukiwania produktów, rekomendacji produktów i ofert, miejsc sprzedaży, wykrywania oszustw, tłumaczeń i wielu innych. Choć mniej widoczny, znaczny wpływ uczenia maszynowego będzie tego typu - po cichu, ale w znaczący sposób usprawni podstawowe operacje ”.

Jednym z najbardziej pomocnych przykładów jest pojawienie się sieci neuronowej - jest to popularna i popularna metoda konfigurowania procesów uczenia maszynowego.

W swojej najbardziej podstawowej formie sieć neuronowa składa się z warstw sztucznych neuronów. Każdy pojedynczy sztuczny neuron ma funkcjonalność równoważną neuronowi biologicznemu - ale zamiast synaps i dendrytów ma dane wejściowe, funkcję aktywacji i ewentualne wyniki.

Sieć neuronowa ma działać jak ludzki mózg, a specjaliści od uczenia maszynowego często wykorzystują ten model do tworzenia wyników uczenia maszynowego.

To jednak nie jedyny sposób uczenia maszynowego. Niektóre bardziej podstawowe projekty uczenia maszynowego obejmują po prostu pokazanie komputerowi szerokiej gamy zdjęć (lub dostarczenie mu innych nieprzetworzonych danych), wprowadzanie pomysłów poprzez proces korzystania z nadzorowanego uczenia maszynowego i danych na etykietach oraz umożliwienie komputerowi rozróżnienia między różne kształty lub przedmioty w polu widzenia. (Aby zapoznać się z podstawami uczenia maszynowego, zobacz Machine Learning 101.)

Dwie najnowocześniejsze dyscypliny

Podsumowując, uczenie maszynowe jest cenną częścią nauki o danych. Ale nauka danych reprezentuje ogromną granicę i wady, w których odbywa się uczenie maszynowe.

W pewnym sensie można powiedzieć, że uczenie maszynowe nigdy nie odbyłoby się bez dużych zbiorów danych. Same duże dane nie stworzyły uczenia maszynowego - zamiast tego, po zbiorowym zebraniu tak dużej ilości danych, że prawie nie wiedzieliśmy, co z tym zrobić, najwyżsi umysły wymyślili te bio-symulujące procesy jako sposób doładowania dostarczania informacji.

Kolejną dobrą rzeczą, o której należy pamiętać, jest to, że nauki o danych można zastosować na dwa główne sposoby - możemy objąć uczenie maszynowe i sztuczną inteligencję, pozwalając komputerom myśleć za nas, lub możemy przywrócić naukę danych do podejścia bardziej skoncentrowanego na człowieku, w którym komputer po prostu przedstawia wyniki, a my jako ludzie podejmujemy decyzje.

To powoduje, że niektórzy eksperci, w tym niektórzy z najlepszych współczesnych innowatorów, wzywają do bardziej dynamicznego rozliczania sposobów korzystania z tych technologii.

„(AI) jest w stanie osiągnąć znacznie więcej niż prawie każdy wie, a tempo poprawy jest wykładnicze”, powiedział Elon Musk, ostrzegając jednocześnie, że uczenie maszynowe i programy AI wymagają nadzoru.

W każdym razie zarówno nauka danych, jak i uczenie maszynowe są podstawowymi elementami postępu, który my, społeczeństwa, dokonujemy dzisiaj w dziedzinie technologii.