4 mity na temat rozpoczęcia projektu uczenia maszynowego

Wideo: Mity kompetencyjne polskiej edukacji | Prof. Barbara Fatyga | Pokazać–Przekazać 2019

Zawartość

Mit nr 1: Więcej danych jest zawsze lepsze
Mit nr 2: Dane, które mamy, są wystarczające
Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia
Mit nr 3: To dla nas za wcześnie!
Mit nr 4: Uczenie maszynowe jest zawsze takie samo
Mit nr 5: Uczenie maszynowe działa tylko przy starannie dobranych danych

Źródło: monsitj / iStockphoto

Na wynos:

Dowiedz się o tych mitach uczenia maszynowego, aby lepiej ukierunkować się na adopcję w przedsiębiorstwie.

Nie jest to rzecz lekką - rozpoczęcie od projektu uczenia maszynowego może być zniechęcającym procesem dla kadry kierowniczej, która chce skorzystać z tego trendu IT, ale może nie mieć wewnętrznej wiedzy, aby naprawdę zrozumieć tajniki maszyny projekty edukacyjne zaznacz.

W tym artykule omówimy niektóre podstawowe nieporozumienia, które mają wpływ na to, jak firmy rozwijają technologie uczenia maszynowego na szybko zmieniającym się rynku. (Nauka o danych to kolejna dziedzina, którą wdrażają firmy, ale czym różni się od ML? Dowiedz się w Data Science lub Machine Learning? Oto jak dostrzec różnicę).

Mit nr 1: Więcej danych jest zawsze lepsze

To naprawdę jeden z największych mitów uczenia maszynowego. Ludzie myślą, że więcej danych oznacza większą zdolność do doskonalenia przydatnych informacji. W niektórych przypadkach mają rację, ale częściej może być odwrotnie.

Więcej danych jest lepsze tylko wtedy, gdy są to odpowiednie dane, które dodają do całego obrazu. Dane muszą pasować do modelu uczenia maszynowego, w przeciwnym razie program może cierpieć z powodu czegoś, co nazywa się „przeuczeniem”, w którym wyniki uczenia maszynowego nie pojawiają się w sposób, w jaki powinny.

„Przyczyną niskiej wydajności w uczeniu maszynowym jest albo nadmierne, albo niedopasowanie danych”, pisze Jason Brownlee w Machine Learning Mastery.

W statystykach dopasowanie odnosi się do tego, jak dobrze przybliżasz funkcję celu. Jest to dobra terminologia stosowana w uczeniu maszynowym, ponieważ nadzorowane algorytmy uczenia maszynowego dążą do przybliżenia nieznanej podstawowej funkcji mapowania zmiennych wyjściowych, biorąc pod uwagę zmienne wejściowe. Statystyki często opisują dobroć dopasowania, która odnosi się do miar użytych do oszacowania, jak dobrze przybliżenie funkcji pasuje do funkcji docelowej.

Mówiąc wprost, obce dane mogą powodować poważne problemy. Przed uruchomieniem projektu uczenia maszynowego kadra kierownicza i inni interesariusze muszą przeprowadzić burzę mózgów i dowiedzieć się, jakie są konkretne typy danych, które zapewnią właściwą podstawę do dalszych działań.

Mit nr 2: Dane, które mamy, są wystarczające

Ponownie procesy uczenia maszynowego działają na bardzo precyzyjnych modelach danych. Dane nie są wystarczająco dobre, chyba że są wyraźnie ukierunkowane oraz poddane ubojowi lub ocenie w celu uwzględnienia takich błędów, jak odchylenie i wariancja.

Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia

Nie możesz poprawić swoich umiejętności programistycznych, gdy nikt nie dba o jakość oprogramowania.

Jedną rzeczą, o której często słyszysz w świecie uczenia maszynowego, jest niekontrolowane uprzedzenie. Uczenie maszynowe przyjmuje nasze ludzkie uprzedzenia i wzmacnia je poprzez zmiażdżenie danych, które program osiąga potencjalnie ekstremalne wyniki.

Oznacza to, że dane muszą być dodatkowo ukierunkowane, aby nadrobić tę tendencję.

Mit nr 3: To dla nas za wcześnie!

Niektóre firmy obawiają się, że jest jeszcze za wcześnie, aby wkroczyć w uczenie maszynowe. Ale jeśli porozmawiasz z wieloma innowatorami i przedsiębiorcami, powiedzą, że jest to właściwy czas na wejście na parter.

Niezależnie od tego, gdzie jest ten trend IT, chcesz być na czele. W awangardzie jest najlepsza pozycja. Oczekiwanie na uzyskanie idealnego wszystkiego może w długim okresie kosztować firmę. (Aby dowiedzieć się więcej o powodach, dla których firmy jeszcze nie wdrożyły ML, zobacz 4 przeszkody, które wstrzymują przyjęcie uczenia maszynowego).

Mit nr 4: Uczenie maszynowe jest zawsze takie samo

Zdecydowanie istnieje szerokie spektrum programów uczenia maszynowego.

Niektóre z nich zasadniczo nie mają jednego algorytmu - są matematycznie czytelne i przejrzyste. Inżynierowie mogą zobaczyć, w jaki sposób przepływające dane korelują z tym, co wychodzi z systemu.

Inne procesy uczenia maszynowego są znacznie bardziej skomplikowane i trudniejsze do zrozumienia. Sieci neuronowe złożone ze sztucznych neuronów mogą zasadniczo stać się „czarną skrzynką”, w której nawet najlepsi inżynierowie mają trudności ze śledzeniem danych w systemie lub wyjaśnianiem działania algorytmów.

„Najbardziej wydajne technologie - a mianowicie głębokie sieci neuronowe - są wyjątkowo nieprzejrzyste, oferując niewiele wskazówek, jak dojść do swoich wniosków”, pisze Ariel Bleicher z Scientific American, omawiając aspekty tej zasadniczej zagadki.

Narzędzia takie jak sieci stanów echa biorą ten pomysł czarnej skrzynki i działają z nim. To sprawia, że tym trudniej jest naprawdę w pełni ustalić, jak działają te systemy.

Mit nr 5: Uczenie maszynowe działa tylko przy starannie dobranych danych

Chociaż powyższy punkt dotyczący danych precyzyjnych jest nadal prawdziwy, dwa różne typy uczenia maszynowego działają na zasadniczo innych podstawach.

Jeden rodzaj uczenia maszynowego zwany nadzorowanym uczeniem maszynowym dotyczy danych oznaczonych - dane szkoleniowe mają już etykiety opisujące jego właściwości i kategorie.

Inny rodzaj uczenia maszynowego nazywa się uczeniem maszynowym bez nadzoru. Zajmuje się danymi nieznakowanymi.

Uczenie maszynowe bez nadzoru pobiera nieprzetworzone dane, a maszyna zasadniczo analizuje je pod kątem cech i samodzielnie grupuje w kategorie. Oba rodzaje uczenia maszynowego mają duży potencjał, ale łatwiej jest skonfigurować program z etykietowanymi danymi do nadzorowanego uczenia maszynowego. Uczenie maszynowe bez nadzoru jest dla wielu firm rodzajem nieznanych wód.

Oto niektóre z rozważań, jakie możesz mieć, oraz nieporozumienia na temat uczenia maszynowego, które mogą powodować problemy w adaptacji przedsiębiorstwa. Mamy nadzieję, że pomogło to rozwiązać pewne problemy związane z projektami uczenia maszynowego.