12 kluczowych wskazówek dotyczących nauki danych

Autor: Laura McKinney
Data Utworzenia: 3 Kwiecień 2021
Data Aktualizacji: 26 Czerwiec 2024
Anonim
12 kluczowych wskazówek dotyczących nauki danych - Technologia
12 kluczowych wskazówek dotyczących nauki danych - Technologia

Zawartość


Źródło: Artinspiring / Dreamstime.com

Na wynos:

Badacze danych oczywiście potrzebują silnych umiejętności matematycznych i programistycznych, ale komunikacja i inne umiejętności miękkie są również niezbędne do osiągnięcia sukcesu.

Datadata zajmuje najlepsze miejsce w 2019 roku w Ameryce na Glassdoor. Przy medianie pensji podstawowej wynoszącej 108 000 USD i stopie zadowolenia z pracy wynoszącej 4,3 na 5, a także przewidywanej dużej liczbie ofert pracy, nie jest to zaskakujące. Pytanie brzmi: co trzeba zrobić, aby się zakwalifikować do tej pracy?

Aby się tego dowiedzieć, szukaliśmy porad udzielonych tym, którzy chcą wejść na tę ścieżkę kariery. Wiele sprowadza się do trudnych umiejętności kodowania i matematyki. Ale to samo mocne obliczenie nie ogranicza tego. Odnoszący sukcesy naukowcy zajmujący się danymi muszą także móc rozmawiać z przedsiębiorcami na własnych warunkach, co wymaga umiejętności związanych z miękkimi umiejętnościami i przywództwem. (Aby dowiedzieć się więcej o obowiązkach naukowca danych, zobacz Job Role: Data Scientist.)


Budowanie edukacyjnej podstawy: trzy podstawowe wskazówki

Drace Zhan, badacz danych z NYC Data Science Academy, podkreśla potrzebę stworzenia podstawy edukacyjnej, która zawiera podstawy kodowania i umiejętności matematyczne:

  1. R / Python + SQL. Jeśli nie masz umiejętności kodowania, potrzebujesz dużej mocy sieci i innych obszarów, aby pogłębić ten deficyt. Widziałem naukowców o słabych umiejętnościach matematycznych i niewielkim doświadczeniu w dziedzinie domen, ale zawsze wykazywała się silną umiejętnością kodowania. Python jest idealny, ale R jest doskonałym narzędziem awaryjnym. Najlepiej mieć oba w swoim arsenale. SQL jest również niezwykle ważny dla analityka danych.

  2. Silne umiejętności matematyczne. Lepsze zrozumienie kilku powszechnie stosowanych metod: uogólnionych modeli liniowych, drzewa decyzyjnego, średnich K i testów statystycznych jest lepsze niż szeroki obraz różnych modeli lub specjalizacji, takich jak RNN.

Są to kluczowe umiejętności, na których można się opierać, choć dodają je niektórzy eksperci. Na przykład lista KDnuggets zawiera komponenty kodowania, o których wspomniał Zhan, i dodaje kilka innych przydatnych rzeczy, które należy wiedzieć po stronie technicznej, w tym platformę Apache Spark platformy Hadoop, wizualizację danych, dane nieustrukturyzowane, uczenie maszynowe i sztuczną inteligencję.


Ale jeśli weźmiemy nasze wskazówki z ankiety dotyczącej najczęściej używanych narzędzi zidentyfikowanych do użycia w prawdziwym życiu przez ankietę Kaggle, otrzymamy nieco inne wyniki. Jak widać na wykresie 15 najlepszych opcji poniżej, Python, R i SQL z łatwością zajmują pierwsze trzy miejsca, ale czwarty to notebooki Jupyter, a następnie TensorFlow, Amazon Web Services, powłoka Unix, Tableau, C / C ++, NoSQL , MATLAB / Octave i Java, wszystko przed Hadoop i Spark. Kolejnym dodatkiem, który może zaskoczyć ludzi, jest eksploracja danych Microsoft Excel.

Zdjęcie dzięki uprzejmości Kaggle

Lista KDnuggets zawiera również wskazówkę dotyczącą edukacji formalnej. Większość naukowców zajmujących się danymi ma stopnie naukowe: 46 procent ma doktoraty, a 88 procent posiada co najmniej tytuł magistra. Posiadane przez nich stopnie licencjackie są zasadniczo podzielone między powiązane obszary. Około jedna trzecia zajmuje się matematyką i statystykami, które są najbardziej popularne na tym torze kariery. Kolejnym najbardziej popularnym jest stopień informatyki, posiadany przez 19 procent, oraz inżynieria, wybór 16 procent. Oczywiście narzędzia techniczne specyficzne dla nauki o danych często nie są badane w programach studiów, ale na specjalistycznych obozach rekrutacyjnych lub na kursach internetowych.

Więcej niż kursy: dwie dodatkowe wskazówki

Hank Yun, asystent naukowy na Wydziale Płuc w Weill Cornell Medicine i student NYC Data Science Academy, radzi początkującym naukowcom danych zaplanować, nad czym będą pracować i znaleźć mentora. Powiedział:

Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia

Nie możesz poprawić swoich umiejętności programistycznych, gdy nikt nie dba o jakość oprogramowania.

Nie popełnij błędu, który popełniłem, mówiąc sobie, że znasz się na informatyce, ponieważ ukończyłeś kurs i otrzymałeś certyfikat. To świetny początek, ale kiedy zaczniesz się uczyć, wybierz projekt. Znajdź mentora w terenie i od razu rozpocznij projekt pasji! Kiedy jesteś świeży, nie wiesz, czego nie wiesz, więc pomaga, gdy ktoś jest tam, by poprowadzić Cię do tego, co jest dla Ciebie ważne, a co nie. Nie chcesz spędzać dużo czasu na nauce bez niczego do pokazania!

Wiedza, które narzędzie należy wyjąć z zestawu narzędzi: Wskazówka, aby pozostać przed zakrętem

Biorąc pod uwagę rozbieżność w rankingu narzędzi do analizy danych, niektórzy mogą czuć się zakłopotani tym, na czym się skupić. Celeste Fralick, główny specjalista ds. Danych w firmie McAfee zajmującej się oprogramowaniem do bezpieczeństwa, porusza ten problem w artykule CIO, który analizuje podstawowe umiejętności specjalisty ds. Danych, oświadczając: „Analityk danych musi pozostać w czołówce badań, a także zrozumieć, jaką technologię zastosować. ”Oznacza to, że nie„ zwabia się ”, że„ sexy ”i nowy, gdy faktyczny problem” wymaga czegoś więcej. „Świadomość kosztów obliczeniowych dla ekosystemu, interpretowalności, opóźnień, przepustowości i innych warunków brzegowych systemu - a także dojrzałości klienta - pomaga badaczowi danych zrozumieć, jaką technologię zastosować.”

Niezbędne umiejętności miękkie: kolejne sześć wskazówek

Punkt, który porusza Fralick, dotyczy nietechnicznych umiejętności, których wymaga praca informatyka. Właśnie dlatego lista KDnuggets obejmuje te cztery: ciekawość intelektualną, pracę zespołową, umiejętności komunikacyjne i umiejętności biznesowe. Zhan umieścił także kluczowe umiejętności miękkie w swoich wskazówkach dla naukowców zajmujących się danymi, identyfikując „umiejętności komunikacyjne”, takie jak KDnuggets, ale używając „wiedzy fachowej w dziedzinie” zamiast „przenikliwości biznesowej”. Jakkolwiek się nazywa, odnosi się do praktycznego zastosowania nauki o danych do biznes. (Aby dowiedzieć się więcej na temat umiejętności komunikacyjnych, zobacz Znaczenie umiejętności komunikacyjnych dla specjalistów technicznych).

Olivia Parr-Rud zaoferowała swoje własne podejście, dodając jeszcze dwie miękkie umiejętności, kładąc nacisk na rolę kreatywności, stwierdzając: „Myślę, że nauka o danych jest zarówno sztuką, jak i nauką”, co wymaga czerpania mocne strony obu stron mózgu. „Wiele osób mówi o nauce o danych jako o karierze, w której wykorzystuje się głównie lewy mózg. Odkryłem, że aby odnieść sukces, naukowcy zajmujący się danymi muszą wykorzystać cały mózg. ”

Wyjaśniła, że ​​postęp w tej dziedzinie wymaga nie tylko kompetencji technicznych, ale także kreatywności i wizji potrzebnej do przywództwa:

Większość zadań lewostronnych / liniowych można zautomatyzować lub zlecić na zewnątrz. Aby zaoferować przewagę konkurencyjną jako badacze danych, musimy być w stanie rozpoznawać wzorce i syntetyzować duże ilości informacji przy użyciu obu stron naszego mózgu. I musimy być innowacyjnymi myślicielami. Wiele najlepszych wyników wynika z integracji lewego i prawego mózgu.

Podkreśliła również, dlaczego jasne przekazanie wizji jest niezbędne:

Jako naukowcy danych, naszym celem jest wykorzystanie danych, aby pomóc naszym klientom zwiększyć zyski. Większość kadry kierowniczej nie rozumie, co robimy i jak to robimy. Musimy więc myśleć jak liderzy i przekazywać nasze ustalenia i zalecenia w języku, który nasi interesariusze rozumieją i którym ufają.

Tuzin danych

Kluczowe wskazówki obejmują większą liczbę narzędzi technicznych, umiejętności i możliwości, a także mniej wymierne cechy, takie jak predyspozycje do kreatywności i przywództwa. Ostatecznie nie jest to tylko gra liczbowa. Ponieważ nauka danych nie polega tylko na tworzeniu modeli w próżni, ale na tworzeniu praktycznych aplikacji do rozwiązywania rzeczywistych problemów dla firm, ci, którzy odniosą sukces w tej dziedzinie, muszą nie tylko opanować technologię, ale także poznać swoją domenę biznesową i zrozumieć potrzeby różni członkowie zespołu w pracy.