Rola pracy: Data Scientist

Autor: Roger Morrison
Data Utworzenia: 28 Wrzesień 2021
Data Aktualizacji: 11 Móc 2024
Anonim
What REALLY is Data Science? Told by a Data Scientist
Wideo: What REALLY is Data Science? Told by a Data Scientist

Zawartość


Źródło: Sergey Khakimullin / iStockphoto

Na wynos:

Naukowcy zajmujący się danymi mają szeroki zakres zadań, które różnią się znacznie w zależności od aplikacji. Ale jedną wspólną cechą jest dążenie do dobrego wykorzystania danych.

Co robi specjalista od danych w ramach sztucznej inteligencji i uczenia maszynowego? Wielu profesjonalistów, którzy codziennie zajmują się tego rodzaju projektami, powiedziałoby, że na pytanie trudno jest odpowiedzieć po prostu. Lepszym pytaniem byłoby: Czego NIE robią badacze danych?

Analityk danych jest integralną częścią procesu AI lub ML, w tym sensie, że wszystkie te projekty zależą od dużych zbiorów danych lub złożonych danych wejściowych. Analityk danych to niezbędny zawodowiec, który wie, jak pracować z danymi w celu uzyskania wyników.

Istnieją jednak sposoby, aby porozmawiać o tym, co robi naukowiec, jakich kwalifikacji potrzebuje i jaka jest jego rola w tym procesie.


Czytać: 6 kluczowych koncepcji nauki o danych, które możesz opanować poprzez naukę online

Różne definicje, różne obowiązki

Wielu ekspertów, którzy opisują pracę naukowca danych, mówi o tym szeroko.

„W małych firmach lub podczas pracy na nowym rynku rolą badacza danych jest przekształcanie stosunkowo nowych (ale oczywistych) źródeł danych w rzeczy, które rozwiązują problem dla użytkownika końcowego, co wcześniej nie było możliwe, gdzie stosowane technologie nie istniały ”- mówi Antonio Hicks, Account Manager w Mercury Global Partners. „Idealnym kandydatem jest ktoś, kto jest częściowo matematykiem, po części inżynierem oprogramowania i po części przedsiębiorcą”.

Inni opowiadają się za tym podstawowym pomysłem, wspominając o tym, czego naukowcy potrzebują do rozwiązania projektów modelowania.

„Najważniejszą cechą, jakiej potrzebuje badacz danych, jest głęboka ciekawość otaczającego świata - niezależnie od tego, czy odpowiadają na pytania, czy budują modele, kluczowa jest chęć zrozumienia stojącego przed nimi problemu”, mówi Erin Akinci, kierownik ds. Danych w Asana. „Stamtąd większość ludzi będzie potrzebować umiejętności matematycznych i programistycznych, aby znaleźć rozwiązania, ale konkretne rodzaje matematyki i programowania różnią się znacznie w zależności od dziedziny wiedzy specjalistycznej w zakresie danych.”


Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia

Nie możesz poprawić swoich umiejętności programistycznych, gdy nikt nie dba o jakość oprogramowania.

„Znakomita praca naukowa ma więcej wspólnego z tym, jak naukowiec myśli o problemie, niż z narzędziami, za pomocą których go rozwiązują”, dodaje Charlie Burgoyne, założyciel i dyrektor generalny Valkyrie Intelligence. Valkyrie to firma konsultingowa zajmująca się naukami stosowanymi, mająca imponujące projekty pod swoim skrzydłem, takie jak Mark I, dedykowane urządzenie sieciowe, które usprawnia szkolenie i testowanie sieci neuronowych, ulepszając to, co jest możliwe w poprzednich platformach uczenia maszynowego w chmurze.

„Rynek wymaga naukowców, którzy są biegli w tworzeniu języka Python, projektowaniu sieci neuronowych i zdolności do przekształcania repozytorium danych w najnowszą architekturę bazy danych”, mówi Burgoyne. „Jednak te zdolności są szansą dla utalentowanego naukowca. Mniej oczywista jest zdolność naukowca do nieustraszonej ciekawości, agresywnej pomysłowości i przestrzegania metody naukowej ”.

Umiejętności naukowca danych

Jeśli chodzi o praktyczne zestawy umiejętności, naukowcy zajmujący się danymi potrzebują pewnej kreatywności i umiejętności w zakresie modelowania. Mogą również wiele zyskać na „twardych umiejętnościach”, takich jak kodowanie doświadczenia w Pythonie, C ++ lub innych popularnych językach stosowanych w projektach ML.

„Python i C ++ są niezbędne, a umiejętność łączenia umiejętności kodowania z analizą i przetwarzaniem danych, a statystyki są podstawowymi umiejętnościami, dzięki którym specjalista od danych będzie wyróżniał się jako silny kandydat lub pracownik” - mówi Val Streif z Pramp, próbnej platformy wywiadu online dla inżynierów oprogramowania, programistów i naukowców zajmujących się danymi. „Podczas gdy niektóre umiejętności programowania można rozwiązać, łącząc specjalistę ds. Danych z programistą, o wiele łatwiej jest połączyć obie umiejętności z jednego punktu widzenia z perspektywy firmy”.

Inni eksperci dodają R, Hadoop, Spark, Sas i Java do listy, a także technologie takie jak Tableau, Hive i MATLAB.

Wszystkie z nich stanowią imponujące CV, ale niektórzy z doświadczonych w rekrutacji naukowców zajmujących się danymi twierdzą, że druga „ludzka” strona też ma znaczenie. (Jeden typ naukowca danych to naukowiec danych obywatelskich. Dowiedz się więcej w Roli badaczy danych obywatelskich w świecie Big Data).

„Tradycyjnie osoby z różnym wykształceniem humanistycznym są doskonałymi naukowcami danych” - mówi Burgoyne, dokonując rozróżnienia między inżynierami, którzy są po stronie budynku, a naukowcami danych, których praca może być o wiele bardziej konceptualna. On kontynuuje:

Wiedza specjalistyczna w tradycyjnej dziedzinie STEM z uzupełniającym się aspektem nauk humanistycznych, artystycznych lub biznesowych daje cechy, które sprawiają, że jest doskonałym naukowcem zorientowanym na przemysł. Trzeba powiedzieć, że równie ważne jest, aby organizacja mogła wykorzystać te cechy i kształtować zapał i metody w produktywny sposób. Zauważyłem, że gdy inicjatywa nauki danych kończy się niepowodzeniem, organizacja jest tak samo winna jak naukowcy. Naukowcy nie są inżynierami. Nie są zmuszani do wykonywania i budowania. Są zmuszeni odkrywać i rozumieć. Organizacje, które dostrzegą tę różnicę, są dobrze nagradzane za uprawę obu pól.

Jeśli chodzi o to, do czego zwykle stosują się naukowcy, ma to związek z podstawowymi celami firmy. Niektóre firmy gonią zdecentralizowany internet - niektóre bawią się IoT lub SaaS. Inni starają się być pionierem „przyjaznej dla użytkownika”, „etycznej” lub „przejrzystej” sztucznej inteligencji.

W każdym razie naukowcy zajmujący się danymi prawdopodobnie zlikwidują podział między twardymi wskaźnikami danych, których używają, na dowolnym stosie technologii, jaki jest w grze, a swobodnym działaniem polegającym na konceptualizacji funkcjonalności AI / ML.

„Zatrudniamy naukowców zajmujących się gromadzeniem i czyszczeniem danych, a także przekształcaniem tych danych w znaczące informacje” - mówi Michael Hupp, menedżer ds. Danych i analizy w G2 Crowd. Opracowuje:

Zazwyczaj oznacza to zarządzanie dowolnymi ważnymi algorytmami napędzającymi silnik danych firmy i biegłą znajomość kluczowych narzędzi analitycznych i języków, ale w ostatnich latach pojawiły się także nowe dziedziny, takie jak przetwarzanie języka naturalnego, uczenie maszynowe, inne formy analizy z wykorzystaniem sztucznej inteligencji. Odnoszący największe sukcesy naukowcy danych to ci, którzy łączą swoje twarde umiejętności z umiejętnością szybkiego uczenia się oraz umiejętnością skutecznego komunikowania odkrytych odkryć, dzięki czemu będą mieć znaczenie dla ich działalności.

Dzięki tego rodzaju spostrzeżeniom łatwiej jest młodym profesjonalistom lub studentom dowiedzieć się, czy specjalista ds. Danych byłby dla nich dobrą rolą i jak zdobyć umiejętności. Nauka STEM staje się coraz bardziej dostępna w szkołach w całym kraju, ale nic nie zastąpi pasji do kodowania i technologii oraz umiejętności uczenia się w locie.