Blog

  1. AZ Frame
  2. /
  3. Bez kategorii
  4. /
  5. Rola celów poziomu usług
Rola celów poziomu usług (SLO) w SRE - Inżynieria niezawodności (SRE) zaczyna zajmować centralne miejsce
05.01.2023 | Ewa Suszek

Ponieważ firmy – celem dalszego usprawnienia operacje biznesowych – zwracają się w stronę automatyzacji chmury i transformacji cyfrowej, w centrum ich uwagi zaczęła pojawiać się inżynieria niezawodności (SRE).

Skuteczne SRE to wysiłek zespołowy. W podobny sposób, w jaki rozgrywający potrzebują obrońców i skrzydłowych, aby wygrywać mecze piłkarskie, inżynierowie niezawodności potrzebują celów poziomu usług (SLO), aby mierzyć, zarządzać i monitorować pożądane wyniki.

Jak wygląda to w praktyce? Jakie kroki są kluczowe dla SRE, aby zapewnić obiektywny sukces dzięki SLO?

Krok 1: Kategoryzacja poziomów usług i danych niezbędnych do ich pomiaru

SLO umożliwiają SRE wyznaczanie celów w oparciu o znaczące metody biznesowe. 75% firm SRE twierdzi, że ich organizacja używa obecnie SLO do oceny poziomu usług dla aplikacji i infrastruktury. Jednak wyzwaniem jest skuteczna kategoryzacja kluczowych poziomów usług i danych wymaganych do ich spełnienia. Dla wielu firm bowiem, kuszące jest podążanie po linii najmniejszego oporu za pomocą aktualnie uchwyconych wskaźników poziomu usług (SLI) do informowania SLO. Problem polega na tym, że takie podejście, choć proste, może wprowadzać niedokładność.

Zamiast tego lepiej zadać proste pytanie: Co jest najważniejsze dla firmy? Z tego poziomu firmy mogą identyfikować cele biznesowe i umowy dotyczące poziomu usług (SLA), które określają efektywne SLO. Chociaż każda firma jest wyjątkowa, wspólne dla wszystkich pozostają cztery, fundamentalne na poziomie usług, cele:

  • Dostępność
  • Zadowolenie użytkownika
  • Wskaźniki błędów
  • Wskaźniki awarii

Krok 2: Konsolidacja danych z monitorowania w jednym „źródle prawdy”

Odcięte od siebie działy-silosy i przeciążenie danych stanowią wyzwanie dla rozwoju i wdrażania celów opartych na usługach. W rzeczywistości 68% SRE twierdzi, że zespoły silosowe i liczne narzędzia utrudniają stworzenie jednego „źródła prawdy” — a 99% SRE twierdzi, że połączenie danych silosowych, wielu metryk i złożonych narzędzi monitorujących stwarza wyzwania w opracowywaniu SLO.

Rozwiązanie tego wyzwania oznacza konsolidację wszystkich danych i zasobów wymaganych dla SLO w jedną platformę obserwowalności, która spełnia potrzeby wszystkich interesariuszy. Tworzy to pojedyncze, współdzielone „źródło prawdy”, które zapewnia spójność i przejrzystość pomiarów na poziomie usług. Ale samo wdrożenie platformy do obserwacji nie wystarczy. Firmy powinny również szukać narzędzi, które obejmują natywne możliwości SLO i upewnić się, że wszystkie pulpity nawigacyjne, budżety błędów, plany naprawcze i mechanizmy alertów są uzgodnione, przetestowane i wdrożone przed uruchomieniem platform.

Krok 3: Skorelowanie wskaźników wydajności z doświadczeniem użytkownika

Bez względu na przydatność narzędzia, usługi lub aplikacji, są one skuteczne tylko wtedy, gdy użytkownicy z niej korzystają. W rezultacie bardzo ważne jest skorelowanie wskaźników wydajności z doświadczeniem użytkownika, celem zrozumienia, w jaki sposób użytkownicy wchodzą w interakcję z kluczowymi zasobami, jakiego rodzaju mają doświadczenia i jak te doświadczenia wpływają na ich zachowanie.

W praktyce oznacza to wykorzystanie kluczowych wskaźników, takich jak dostępność i zaangażowanie. Czy usługa jest zazwyczaj dostępna dla użytkowników? Jak często wchodzą w interakcję z aplikacją lub usługą? Tymczasem, jeśli chodzi o aplikacje mobilne, warto przyjrzeć się takim metrykom, jak wskaźniki przyjęcia aplikacji, oceny aplikacji w popularnych sklepach z aplikacjami, ogólny czas odpowiedzi i liczba awarii na oficjalnie obsługiwanych urządzeniach. Korelacja tych wskaźników umożliwia firmom zidentyfikowanie potencjalnych problemów, zanim wpłyną one negatywnie na SLO.

Wskazówka: Rozważ wzrost wskaźników awarii w połączeniu z szybkim spadkiem ocen aplikacji. Chociaż korelacja nie wskazuje na problem, umożliwia zespołom rozpoczęcie wyszukiwania źródła.

Krok 4: Ocena SLO za pomocą precyzyjnego podejścia opartego na danych

Połowa osób odpowiedzialnych za SRE zauważyła, że ​​ich organizacje mają niewiele znormalizowanej metodologii ustalania celów SLO i mierzenia wyników. W rezultacie cele mogą być ustawione zbyt wysoko lub zbyt nisko; wyjątkowo wysokie cele są prawie niemożliwe do osiągnięcia, podczas gdy bardzo niskie cele są łatwiejsze do osiągnięcia, ale nie stanowią zachęty do poprawy.

W tym przypadku podejście oparte na danych do tworzenia i oceny SLO umożliwia znalezienie najlepszego punktu zarządzania celami na poziomie usług. Rozpoczyna się to od zaawansowanych narzędzi monitorowania, które pomagają prowadzić firmy w kierunku właściwych celów w oparciu o dane historyczne i istniejące standardy branżowe. Ważne jest również zdefiniowanie celu SLO. Na przykład 59% SRE stwierdziło, że wykorzystuje te cele dla przesuwania granic w zakresie obsługi klienta, podczas gdy 49% wykorzystuje je, aby zapewnić, że dostawcy usług realizują swoje cele. 42%  zaś wykorzystuje je, aby zapewnić zespołom IT wgląd w wpływ ich wysiłku na rzecz celów biznesowych.

Na koniec ważne jest zdefiniowanie własności SLO. Najlepsze dopasowanie własności zależy od okoliczności; podczas gdy zespoły programistyczne często mają za zadanie utrzymanie SLO dla aplikacji nieprodukcyjnych, zespoły SRE są często idealnym wyborem dla innych środowisk, aby zapewnić obiektywną spójność

Need help icon

Potrzebujesz wsparcia? Jesteśmy zawsze po Twojej stronie

Chętnie odpowiemy na nurtujące Cię pytania. Naszą największą domeną jest doświadczenie i wiedza, dlatego pomożemy Ci w wielu obszarach.

skontaktuj się