Filtr Bayesa

Zawartość

Definicja - Co oznacza filtr Bayesian?
Wprowadzenie do Microsoft Azure i Microsoft Cloud | W tym przewodniku dowiesz się, na czym polega przetwarzanie w chmurze i jak Microsoft Azure może pomóc w migracji i prowadzeniu firmy z chmury.
Techopedia wyjaśnia filtr bayesowski

Definicja - Co oznacza filtr Bayesian?

Filtr bayesowski to program komputerowy wykorzystujący logikę bayesowską lub analizę bayesowską, które są synonimami. Służy do oceny nagłówka i treści oraz ustalenia, czy stanowi spam - niezamówiony lub elektroniczny odpowiednik masowej lub niepotrzebnej poczty w formie papierowej). Filtr Bayesian najlepiej jest stosować wraz z programami antywirusowymi.

Wprowadzenie do Microsoft Azure i Microsoft Cloud | W tym przewodniku dowiesz się, na czym polega przetwarzanie w chmurze i jak Microsoft Azure może pomóc w migracji i prowadzeniu firmy z chmury.

Techopedia wyjaśnia filtr bayesowski

Filtr bayesowski działa z prawdopodobieństwem pojawienia się określonych słów w nagłówku lub treści pliku. Niektóre słowa wskazują na duże prawdopodobieństwo, że są spamem, takie jak Viagra i refinansowanie. Filtr nie zaczyna się od rozpoznania prawdopodobieństwa, że słowo wskazuje na wysokie prawdopodobieństwo spamu. Użytkownicy muszą ręcznie zidentyfikować spam. Po znalezieniu wystarczającej liczby wystąpień tego słowa i zidentyfikowaniu go jako spam filtr bayesowski „uczy się” rozpoznawania słowa za pomocą funkcji prawdopodobieństwa. To samo dzieje się z wieloma innymi słowami i wyrażeniami. Z czasem filtr bayesowski staje się coraz bardziej skuteczny w identyfikowaniu spamu dla konkretnego użytkownika. Gdy prawdopodobieństwo osiągnie określony próg, na przykład 95 procent, wówczas zostaje zidentyfikowany jako spam i często jest przenoszony do niepotrzebnego folderu (a czasem nawet automatycznie usuwany). Użytkownik może go okresowo przeglądać i decydować, czy go usunąć. Alternatywnie niektóre programy spamowe przenoszą go do miejsca kwarantanny, w którym użytkownicy mogą przeglądać i weryfikować decyzję oprogramowania.

Wstępne „szkolenie” często można udoskonalić, aby zmniejszyć liczbę fałszywych trafień lub fałszywych negatywów w przypadku znalezienia złych osądów. Pozwala to filtrowi bayesowskiemu oprogramowania dostosować się do stale ewoluującego charakteru spamu.

Niektóre filtry antyspamowe wykorzystują również heurystykę wraz z filtrem bayesowskim. Wstępnie zdefiniowane reguły są konfigurowane przez użytkownika w celu dalszego zwiększenia dokładności identyfikacji jako spam. Reguły te mogą obejmować liczbę wystąpień danego słowa, eliminować lub ignorować neutralne słowa, takie jak „the”, „a” lub „some”, lub identyfikować sekwencje dzieł, takich jak „Viagra jest dobra”, w przeciwieństwie do stosowania prawdopodobieństwa funkcja dla wszystkich czterech pojedynczych słów.

Spamerzy mogą stosować technikę zwaną zatruciem bayesowskim, aby obniżyć skuteczność filtrów spamowych za pomocą filtrowania bayesowskiego. Niektóre techniki obejmują wstrzykiwanie wiarygodnych wiadomości lub źródeł literackich, używanie przypadkowych, nieszkodliwych słów, które rzadko występują w spamie, a nawet zastępowanie ich zdjęciami.

Wielu klientów wyłącza wyświetlanie zdjęć ze względów bezpieczeństwa. W ten sposób spam może dotrzeć do mniejszej liczby odbiorców.

Filtr bayesowski wykorzystujący logikę bayesowską może służyć do klasyfikowania dowolnego rodzaju danych. Medycyna, nauka i inżynieria znalazły zastosowanie. Co ciekawe, naukowcy spekulują, że nawet ludzki mózg może korzystać z metodologii logiki bayesowskiej do klasyfikowania bodźców i określania konkretnych zachowań reakcyjnych.