Analiza głównych składników (PCA)

Autor: Roger Morrison
Data Utworzenia: 22 Wrzesień 2021
Data Aktualizacji: 16 Czerwiec 2024
Anonim
Analiza głównych składników (PCA) - Technologia
Analiza głównych składników (PCA) - Technologia

Zawartość

Definicja - Co oznacza analiza głównych składników (PCA)?

Analiza głównych składników (PCA) jest techniką stosowaną do identyfikacji mniejszej liczby nieskorelowanych zmiennych znanych jako główne składniki z większego zestawu danych. Technika ta jest szeroko stosowana w celu podkreślenia zmienności i uchwycenia silnych wzorców w zbiorze danych. Opracowana przez Karla Pearsona w 1901 r. Analiza głównych składników jest narzędziem stosowanym w modelach predykcyjnych i analizie danych eksploracyjnych. Analiza głównych składników jest uważana za przydatną metodę statystyczną i jest stosowana w takich dziedzinach, jak kompresja obrazu, rozpoznawanie twarzy, neuronauka i grafika komputerowa.


Wprowadzenie do Microsoft Azure i Microsoft Cloud | W tym przewodniku dowiesz się, na czym polega przetwarzanie w chmurze i jak Microsoft Azure może pomóc w migracji i prowadzeniu firmy z chmury.

Techopedia wyjaśnia analizę głównych składników (PCA)

Analiza głównych składników pomaga w eksploracji i wizualizacji danych. Jest to prosta nieparametryczna technika wydobywania informacji ze skomplikowanych i mylących zestawów danych. Analiza głównego składnika koncentruje się na maksymalnej wartości wariancji przy najmniejszej liczbie głównych składników. Jedną z wyraźnych zalet związanych z analizą głównego składnika jest to, że po znalezieniu wzorców w danych danych obsługiwana jest również kompresja danych. Wykorzystuje się analizę głównych składowych w celu wyeliminowania liczby zmiennych lub gdy jest zbyt wiele predyktorów w porównaniu z liczbą obserwacji lub w celu uniknięcia wielokoliniowości. Jest ściśle związany z kanoniczną analizą korelacyjną i wykorzystuje transformację ortogonalną w celu przekształcenia zestawu obserwacji zawierających zmienne skorelowane w zbiór wartości zwanych składowymi głównymi. Liczba głównych składników wykorzystywanych w analizie głównych składników jest mniejsza lub równa mniejszej liczbie obserwacji. Analiza głównego składnika jest wrażliwa na względne skalowanie pierwotnie używanych zmiennych.


Analiza głównych składników jest szeroko stosowana w wielu obszarach, takich jak badania rynku, nauki społeczne oraz w branżach, w których stosuje się duże zbiory danych. Ta technika może również pomóc w zapewnieniu niższych wymiarów oryginalnych danych. W przypadku analizy głównych komponentów potrzeba tylko minimalnego wysiłku, aby zredukować złożony i mylący zestaw danych w uproszczony użyteczny zestaw informacji.