5 najlepszych praktyk w zakresie automatyzacji zarządzania poważnymi incydentami

Autor: Roger Morrison
Data Utworzenia: 27 Wrzesień 2021
Data Aktualizacji: 21 Czerwiec 2024
Anonim
5 best practices to improve your Incident Management abilities
Wideo: 5 best practices to improve your Incident Management abilities

Zawartość



Źródło: Pixtum / iStockphoto

Na wynos:

Dzięki inteligentnej strategii automatyzacji możesz szybciej i łatwiej reagować na incydenty - minimalizując przestoje i potencjalne naruszenia bezpieczeństwa.

Poważne incydenty informatyczne mają miejsce w firmach każdego dnia. Chociaż tylko kilka z nich trafia na nagłówki gazet, zdarzenia takie jak przerwy w pracy i naruszenia bezpieczeństwa mogą poważnie osłabić wydajność pracowników, negatywnie wpłynąć na postrzeganie klientów, a co najważniejsze, doprowadzić do utraty przychodów.

Jeśli więc chodzi o zarządzanie poważnymi incydentami informatycznymi, najlepiej skoncentrować się na wpływie firmy i wynikach końcowych. Według Ponemon Institute średni koszt przestoju w 2016 r. Wyniósł 8 851 USD na minutę - to ponad 500 000 USD na godzinę, a typowe przestoje wynoszą średnio ponad 90 minut. A to tylko koszt natychmiastowy! Długoterminowy wpływ, taki jak uszkodzenie reputacji i osłabienie klienta, jest nieprzewidywalny i potencjalnie katastrofalny.


Chociaż nie możesz całkowicie uniknąć wszystkich poważnych incydentów, możesz uzbroić swoją organizację, aby była jak najlepiej przygotowana, aby poradzić sobie z nimi, gdy tylko się pojawią. A głównym elementem strategii powinno być wprowadzenie automatyzacji. Organizacje, które maksymalizują wykorzystanie automatyzacji w swoich procesach rozwiązywania poważnych incydentów, osiągają szybsze przywrócenie usługi i znacznie mniej błędów z powodu błędów ludzkich. Wynika to z faktu, że automatyzacja bezpośrednio wpływa na twoją zdolność do skrócenia czasu trwania wpływu na biznes - lub na ten kosztowny okres, w którym użytkownicy i operacje biznesowe faktycznie odczuwają wpływ incydentu. (Aby dowiedzieć się więcej na temat automatyzacji, zobacz Automatyzacja: przyszłość nauki o danych i uczenia maszynowego?)

Aby zmaksymalizować korzyści płynące z automatyzacji, należy sprawdzić, które działania należy wykonać w oknie wpływu, i dowiedzieć się, jak przenieść wszystkie inne działania przed rozpoczęciem incydentu lub po powrocie firmy do normalnej działalności. Oto pięć pomocnych sposobów na rozpoczęcie pracy.


1. Opracuj i zdefiniuj proces

Zdefiniowanie głównego procesu zarządzania incydentem polega na określeniu, co można zaplanować, skoordynować lub wykonać podczas incydentu. Może to oznaczać na przykład identyfikację kluczowych członków zespołu wsparcia na podstawie zestawu umiejętności i harmonogramu, tak aby biuro obsługi mogło zaangażować ich tak szybko i skutecznie, jak to możliwe. Oznacza to również zastanowienie się, w jaki sposób przekażesz odpowiednie informacje swojemu zespołowi, aby mogli od razu rozpocząć rozwiązywanie problemu, a także informowanie i aktualizowanie odpowiednich zainteresowanych stron.

Automatyzacja ma kluczowe znaczenie dla kluczowych aspektów tego procesu. Na przykład można zautomatyzować włączanie odpowiednich informacji z narzędzi monitorowania do zgłoszeń do działu obsługi technicznej lub włączać informacje z działu obsługi do powiadomień do osób zajmujących się usuwaniem incydentów. Możesz również udokumentować cały incydent za pomocą jednego źródła kompleksowej prawdy, która jest dostępna dla wszystkich. Pamiętaj, że możesz przećwiczyć ten proces, aby zrobić to dobrze - nie musisz czekać na incydent w świecie rzeczywistym, aby przetestować swoje podejście.

2. Popraw infrastrukturę

W dzisiejszych czasach czujnego zmęczenia bardzo ważne jest, aby nie bombardować swoich zespołów nieistotnymi powiadomieniami i informacjami, które ich nie dotyczą. Zastosowanie filtrów do alertów monitorowania pozwoli Twoim zespołom łatwiej wyrównać igłę w stogu siana rutynowego hałasu. Jest to klucz do tego, aby wszystkie twoje spostrzeżenia i dane były naprawdę użyteczne, a nie tylko zwiększanie przeciążenia informacji.

Dobrym sposobem na automatyzację jest użycie rozwiązania APM do przeszukiwania wszystkich aplikacji i systemów w celu proaktywnego identyfikowania przyczyn źródłowych w punkcie obniżenia wydajności, przed spowodowaniem poważnych awarii usług. Możesz także zintegrować monitorowanie, biurko serwisowe, aplikacje do współpracy i narzędzia do czatu, aby udostępniać informacje o zbieżności w czasie rzeczywistym.

Bez błędów, bez stresu - Twój przewodnik krok po kroku do tworzenia oprogramowania zmieniającego życie bez niszczenia życia

Nie możesz poprawić swoich umiejętności programistycznych, gdy nikt nie dba o jakość oprogramowania.

3. Dokładnie zmierz MTTR

Jak mierzysz średni czas naprawy (MTTR)? Czy opierasz go na całkowitym czasie, w jaki zespoły IT są zaangażowane, czy na całkowitym czasie, na jaki faktycznie wpływa to na działalność firmy? Jeśli twoja odpowiedź jest pierwsza, powinieneś ponownie rozważyć zmierzenie okna wpływu przy użyciu perspektywy biznesowej. Jest to o wiele bardziej dokładne przeciwne wysiłki związane z optymalizacją, ponieważ Twoim celem jest zminimalizowanie wpływu incydentów, a nie po prostu przedstawienie lepszej reakcji na forum. (Aby dowiedzieć się więcej o przestojach i sposobie ich obsługi, sprawdź, jaki naprawdę oznacza średni czas między awariami).

Możesz zautomatyzować, zapewniając pełny wgląd w aplikacje, aby w razie potrzeby z wyprzedzeniem „uruchomić zegar” i zachować pełny zapis działań związanych z rozwiązywaniem problemów i komunikacji w celu analizy i audytu w celu usprawnienia procesów.

4. Informuj interesariuszy na bieżąco - ale bez przerywania rozwiązywania

Zainteresowane strony oczekują skutecznej i terminowej komunikacji, a jednocześnie oczekują, że eksperci w danej dziedzinie skupią się na rozwiązaniu problemów. Chociaż możesz wyznaczyć punkt kontaktowy do monitorowania i angażowania użytkowników biznesowych, bardziej skuteczną strategią byłoby stworzenie samoobsługowej strony internetowej z aktualizacjami statusu. To uprawnia interesariusza do sprawdzenia się bez bombardowania twojego zespołu kolejnymi wezwaniami. Pamiętaj tylko o regularnym aktualizowaniu swoich interesariuszy, aby zawsze otrzymywali najnowszy raport o stanie i wiedzieli, że mogą się spodziewać. Nie zapominaj, że komunikacja nie powinna się kończyć tylko dlatego, że usługa została przywrócona! Ważne interesariusze otrzymują podsumowanie tego, co się wydarzyło, czego się nauczyli i jak można temu zapobiec w przyszłości.

W tym przypadku można zastosować automatyzację, aby utworzyć automatyczną stronę statusu w czasie rzeczywistym dla interesariuszy, a także wbudować polecenia ukośnika w narzędzie czatu, aby zaktualizować tę stronę.

5. Zbierz dane w celu wsparcia zarządzania problemami

Przywrócenie usługi nie oznacza końca zarządzania incydentami! W rzeczywistości niektóre z najcenniejszych działań następują po rozwiązaniu. Gromadząc dane diagnostyczne i wpływowe oraz wykonując analizę pierwotnych przyczyn, można przeprowadzić pełny audyt poważnego incydentu, który obejmuje wprowadzenie środków zapobiegawczych w celu uniknięcia podobnych incydentów w przyszłości. Ponadto, nawet jeśli rozpoznawalny incydent wystąpi ponownie, możesz utworzyć zdefiniowaną procedurę dla rodzajów danych, które należy zgromadzić, oraz kroki, które należy wykonać, aby rozwiązać problem. W ten sposób Twój zespół musi po prostu odwołać się do listy kontrolnej i skoncentrować się na głównym celu przywrócenia usługi, zamiast martwić się o to, czego potrzebuje i kiedy.

Automatyzacja może przechwytywać i zachowywać działania związane z rozpoznawaniem, w tym zapisy rozmów na czacie, w jednym systemie zapisu do analizy. Ponadto pomoże Ci zbudować katalog znanych incydentów lub problemów, ugruntować najlepsze praktyki dla każdego z nich, a tym samym zwiększyć szybkość rozwiązywania problemów w przyszłości.

Podsumowując: Automatyzuj mądrzej, nie więcej

Uwaga: większa automatyzacja niekoniecznie jest lepszym podejściem! Ważniejsze jest, aby zrozumieć, kiedy, gdzie i jak połączyć systemy informatyczne w celu obsługi zarządzania incydentami. Nie chcesz dodawać niepotrzebnej złożoności w celu zwiększenia zautomatyzowanych procesów. Pamiętaj, że celem jest maksymalne uproszczenie i konsolidacja operacji, aby Twoje zespoły czuły się upoważnione do skutecznego rozwiązywania problemów. Chodzi o inteligentne wdrożenie automatyzacji, aby ułatwić dobrze skoordynowany zestaw procesów, kompetentny personel i skuteczną komunikację z zainteresowanymi stronami, tak aby zminimalizować ogólny wpływ poważnych incydentów na biznes.