Dlaczego niektóre projekty uczenia maszynowego mogą wymagać ogromnej liczby aktorów?

Zawartość

P:

ZA:

Kiedy myślisz o uczeniu maszynowym, zwykle myślisz o wykwalifikowanych naukowcach danych pracujących na klawiaturach w pokojach komputerowych. Szczególny nacisk kładziony jest na analizę ilościową i algorytmy. W przypadku wielu z tych programów nie ma zbyt wielu bezpośrednich sytuacji w świecie rzeczywistym - przynajmniej tak wielu by pomyślało.

Jednak niektóre z najbardziej przełomowych programów uczenia maszynowego wykorzystują istne armie ludzkich aktorów na ulicy, w sklepach i wszędzie tam, gdzie mogą modelować podstawowe działania człowieka, takie jak spacery, praca czy zakupy.

Artykuł przewodowy Toma Simonite'a ilustruje to bardzo dobrze trafnym tytułem „Aby uczynić AI mądrzejszym, ludzie wykonują dziwne zadania o niskim wynagrodzeniu”.

Na przykładzie krótkich filmów wideo zrobionych w sklepie spożywczym Whole Foods Simonite podkreśla rodzaje pracy, które pomogą rozwinąć kolejną fazę uczenia maszynowego.

Prowadzi to do pytania, dlaczego wszystkie te osoby są zaangażowane w filmowanie się w krótkich i prostych filmach dokumentujących działania tak podstawowe jak poruszanie ręką lub nogą.

Odpowiedź rzuca nieco światła na to, gdzie jest uczenie maszynowe i dokąd zmierza.

„Naukowcy i przedsiębiorcy chcą, aby sztuczna inteligencja rozumiała i działała w świecie fizycznym”, pisze Simonite, wyjaśniając, dlaczego on i inni wędrują kamerami. „Stąd potrzeba, aby pracownicy odgrywali sceny w supermarketach i domach. Generują materiały instruktażowe, aby uczyć algorytmów o świecie i ludziach w nim żyjących. ”

Jak zauważy wielu ekspertów, jedne z największych granic uczenia maszynowego obejmują przetwarzanie obrazu i przetwarzanie języka naturalnego. Są to niezwykle ilościowe procedury - innymi słowy, nie ma szerokiego spektrum danych wejściowych, jak w rzeczywistych środowiskach „wydajnych”. Zamiast tego programy uczenia maszynowego wykorzystują dane wizualne i dźwiękowe w bardzo specyficzny sposób do budowania modeli. Dzięki przetwarzaniu obrazu jego funkcje pobierania obejmują (skończone) pole widzenia. W przypadku NLP: jego fonemy składające.

Wykraczanie poza te konkretne kategorie wprowadzania wiąże się z czymś, co można nazwać „luką w obrazie i mowie” - wykraczając poza takie funkcje, jak przetwarzanie obrazu i rozpoznawanie mowy, przenosisz się do obszarów, w których komputery muszą być analityczne na różne sposoby. Zestawy treningowe będą zasadniczo różne.

Wejdź do armii filmowców. W niektórych z tych nowych projektów uczenia maszynowego najmniejszymi pomysłami na ludzkie działania są zestawy szkoleniowe. Zamiast szkolić się w poszukiwaniu funkcji, krawędzi i pikseli, które składają się na zadania klasyfikacyjne, komputery zamiast tego używają filmów szkoleniowych do oceny, jak wyglądają różne rodzaje akcji.

Kluczową sprawą jest to, co inżynierowie mogą zrobić z tymi danymi, gdy są one agregowane i ładowane, a komputer jest na nich szkolony. Wkrótce zobaczysz wyniki w różnych dziedzinach - na przykład sprawi, że nadzór będzie niezwykle skuteczny. Komputery będą mogły „zobaczyć” w polu widzenia, co ludzie robią, i zastosować to do dziedzin takich jak marketing i sprzedaż, a może, w niektórych przypadkach, praca agencji rządowej lub sądownictwo karne.

Konsekwencje rzucają również nieco światła na debatę między pytaniami dotyczącymi maksymalnych korzyści i prywatności. Wiele z wykorzystania tych filmów zbuduje modele uczenia maszynowego, które sprawdzą się w monitoringu - ale co z ludźmi, którzy nie chcą być badani? Kiedy te nowe programy uczenia maszynowego są wdrażane w przestrzeni publicznej, jakie są prawa jednostki i gdzie ta linia jest narysowana?

W każdym razie firmy używają tego rodzaju zasobów ludzkich i wideo, aby naprawdę zagłębić się w kolejne rundy postępów w uczeniu maszynowym, które pozwolą komputerom rozpoznać, co się wokół nich dzieje, zamiast tylko klasyfikować obrazy lub pracować z fonemami przemówienie. Jest to niezwykle interesujący i kontrowersyjny rozwój sztucznej inteligencji, który zasługuje na uwagę w mediach technicznych i nie tylko.