Analiza mowy

Autor: Robert Simon
Data Utworzenia: 23 Czerwiec 2021
Data Aktualizacji: 24 Czerwiec 2024
Anonim
Analiza mowy ciała Putin vs Zełenski
Wideo: Analiza mowy ciała Putin vs Zełenski

Zawartość

Definicja - Co oznacza analiza mowy?

Analiza mowy to proces wyodrębniania istotnych i istotnych treści z nagranego pliku audio. Ma możliwość automatycznej identyfikacji, kategoryzacji i odsyłania do ważnych informacji dotyczących tego, co zostało powiedziane lub faktycznej treści lub znaczenia mowy, a nie tylko pojedynczych słów. Aby to umożliwić, analityka mowy korzysta z kilku rodzajów aplikacji, takich jak narzędzia do automatycznego rozpoznawania mowy i wyszukiwania dźwięku.


Wprowadzenie do Microsoft Azure i Microsoft Cloud | W tym przewodniku dowiesz się, na czym polega przetwarzanie w chmurze i jak Microsoft Azure może pomóc w migracji i prowadzeniu firmy z chmury.

Techopedia wyjaśnia analizę mowy

Istnieją trzy główne podejścia w analizie mowy: synteza mowy, bezpośrednie rozpoznawanie fraz i fonetyka.

  • Speech-to-: Wykorzystuje bi-gram lub tri-gram jako podstawowe jednostki w analizie mowy i musi być dopasowany do tysięcy słów. Rezultatem jest przepływ słów, który ułatwia pracę, a także jest dokładny.
  • Bezpośrednie rozpoznawanie faz: bezpośrednio analizuje mowę, wyszukując predefiniowane frazy zamiast konwertując je na fonemy. Chociaż jest to najdłuższa metoda, jest również najdokładniejsza, ponieważ podczas konwersji danych nie są tracone żadne informacje.
  • Fonetycznie: najszybszym sposobem przetwarzania, ponieważ podstawową jednostką jest fonem. Biorąc pod uwagę, że w większości języków znanych jest tylko kilka fonemów, używana jest długa ich lista, do której oprogramowanie odwołuje się w celu kierowania fonemów do najbliższej z listy.