Jak zautomatyzować monitorowanie systemu przy użyciu Pythona

Maya Patel included in Programming Python System Monitor

2023-10-11 1437 words 7 minutes

Contents

Większość organizacji polega w dużej mierze na swojej infrastrukturze IT, aby prowadzić swoją działalność. Nieplanowane awarie systemu lub spadek wydajności mogą prowadzić do zakłóceń, strat finansowych i utraty reputacji.

Zautomatyzowany system przeprowadzania okresowych ocen kondycji jest niezbędny do zapewnienia stabilności i niezawodności infrastruktury informatycznej organizacji. Poprzez ciągłe śledzenie istotnych wskaźników i terminową identyfikację wszelkich odchyleń od normalnych wzorców, można znacznie zmniejszyć potencjał wydłużonych okresów zakłóceń operacyjnych.

Definiowanie kontroli kondycji

Aby skutecznie ocenić kondycję danego systemu, konieczne jest określenie, które kontrole kondycji są uważane za konieczne. Wiąże się to z ustanowieniem wyraźnych wytycznych dotyczących parametrów, które będą ściśle obserwowane, a także z określeniem uzasadnienia takiego monitorowania. Aby rozpocząć ten proces, należy najpierw zidentyfikować nadrzędne cele danego systemu. Jakie funkcje lub oferty zapewnia?

W celu ustalenia skutecznych wskaźników wydajności dla infrastruktury IT, kluczowe jest ustalenie wartości bazowych poprzez analizę wcześniejszych trendów w wykorzystaniu systemu. Pozwoli to określić odpowiednie poziomy zużycia zasobów i zidentyfikować potencjalne wąskie gardła. Dodatkowo, ustalenie konkretnych kryteriów wyzwalania alertów może pomóc administratorom w szybkim reagowaniu na problemy przed ich eskalacją. Wartości progowe dla uznania wykorzystania zasobów za wysokie lub niskie mogą się różnić w zależności od czynników, takich jak wzorce obciążenia i dostępna pojemność. Istotne jest, aby dokładnie rozważyć te parametry i jasno przekazać je zespołom w celu utrzymania optymalnej wydajności systemu.

Wybór bibliotek i konfiguracja środowiska

Aby wdrożyć zautomatyzowane rozwiązanie do monitorowania systemu przy użyciu Pythona, należy wykorzystać zestaw bibliotek do zbierania danych o wydajności systemu i ustanawiania regularnych punktów kontrolnych. Biblioteki te umożliwiają wydajne wykonywanie zadań przy jednoczesnym zapewnieniu wiarygodnej oceny wydajności.

Psutil to wszechstronna biblioteka, która umożliwia użytkownikom uzyskiwanie danych dotyczących wydajności systemu na różnych platformach, w tym wykorzystania procesora, alokacji pamięci, aktywności dysku, przepustowości sieci i odczytów czujników.

Niniejsza biblioteka oferuje nieskomplikowany sposób organizowania przedsięwzięć, które mają być wykonywane we wcześniej określonych przedziałach czasowych.

Biblioteka standardowa Pythona zawiera wbudowany moduł o nazwie “time”, który zapewnia funkcje związane z zarządzaniem danymi czasowymi i manipulowaniem nimi, takie jak pobieranie bieżącej daty i godziny, obliczanie odstępów czasu między dwoma punktami w czasie, ustawianie zegarów systemowych i inne. Moduł ten służy jako niezbędny zasób dla aplikacji wymagających możliwości pomiaru czasu w ramach ich oprogramowania.

Moduł logowania Pythona służy jako wbudowane narzędzie do generowania i utrzymywania zapisów dziennika, umożliwiając programistom śledzenie i monitorowanie wydajności i stanu ich systemów poprzez zorganizowane przechowywanie zapisów.

Aby rozpocząć, utwórz nowe wirtualne środowisko Pythona, które złagodzi ewentualne rozbieżności w wersjach bibliotek. Następnie wykonaj kolejne instrukcje terminala za pomocą “Pip”, aby zainstalować niezbędne biblioteki.

 pip install psutil schedule

Po pomyślnym zainstalowaniu i skonfigurowaniu niezbędnych bibliotek w środowisku komputerowym, można śmiało przystąpić do ich wykorzystania w celu osiągnięcia zamierzonej funkcjonalności.

Pełny kod źródłowy jest dostępny za pośrednictwem repozytorium GitHub, które zapewnia łatwy dostęp do plików i zasobów projektu w celu dalszego rozwoju lub modyfikacji.

Importowanie wymaganych bibliotek

Zainicjowanie rozwoju innowacyjnego skryptu Pythona o nazwie “monitoring.py”, który rozpocznie się od zaimportowania niezbędnych modułów i frameworków niezbędnych do jego wykonania.

 import psutil
import schedule
import time
import logging

Rzeczywiście, import tych bibliotek umożliwia wykorzystanie ich odpowiednich funkcji w ramach własnej bazy kodu.

Rejestrowanie i raportowanie

Aby skutecznie śledzić wyniki badań lekarskich, konieczne jest ustanowienie systemu rejestrowania takich informacji. Praktyka ta służy nie tylko do dokumentowania i przechowywania archiwalnych danych dotyczących przeszłych zdarzeń, ale także ułatwia identyfikację i rozwiązywanie wszelkich problemów, które mogą pojawić się w ramach kodu. Co więcej, dokładna dokumentacja poprzez rejestrowanie może znacząco przyczynić się do oceny ogólnej wydajności.

Wykorzystaj wbudowaną funkcję rejestrowania, aby wygenerować dzienniki dla tego przedsięwzięcia. Wpisy dziennika mogą być zapisywane w pliku o nazwie “system\_monitor.log”.

 # Function to log messages
def log_message(message):
    # Configure logging
    logging.basicConfig(filename='system_monitor.log', level=logging.INFO,
                       format='%(asctime)s - %(message)s')
    logging.info(message)

Aby ułatwić szybką komunikację dotyczącą wszelkich pilnych kwestii, zaleca się wyświetlanie wizualnego wskazania w postaci komunikatu ostrzegawczego na konsoli systemu w celu natychmiastowego uświadomienia i rozważenia.

 # Function to print alerts to the console
def print_alert(message):
    print(f"ALERT: {message}")

Funkcje sprawdzania kondycji wykorzystują te funkcje do rejestrowania i rozpowszechniania istotnych informacji.

Tworzenie funkcji sprawdzania kondycji

Aby wdrożyć skuteczne sprawdzanie kondycji infrastruktury IT, zaleca się utworzenie oddzielnych funkcji w systemie monitorowania, które koncentrują się na badaniu kluczowych aspektów wydajności i stabilności sieci. Izolując te testy w dedykowanych funkcjach, można skuteczniej śledzić kondycję różnych komponentów i wykrywać potencjalne problemy, zanim przerodzą się one w większe problemy.

Monitorowanie wykorzystania procesora

Wdrożenie skutecznego mechanizmu monitorowania wykorzystania procesora ma fundamentalne znaczenie dla oceny wydajności operacyjnej i alokacji zasobów danego systemu. Wykrycie podwyższonego poziomu wykorzystania procesora może pomóc zidentyfikować potencjalne wąskie gardła lub problemy, które mogą prowadzić do zmniejszenia wydajności, powolnego reagowania i ewentualnych awarii systemu, co może znacząco wpłynąć na kluczowe usługi, na których polegają użytkownicy.

Dzięki konsekwentnemu monitorowaniu wykorzystania procesora i ustalaniu odpowiednich poziomów progowych, administratorzy systemu są w stanie wskazać przeszkody w wydajności, procedury wymagające dużej ilości zasobów lub podejrzewane problemy sprzętowe poprzez identyfikację odchyleń od oczekiwanych wzorców zachowań.

 # Health check functions
def check_cpu_usage(threshold=50):
    cpu_usage = psutil.cpu_percent(interval=1)

    if cpu_usage > threshold:
        message = f"High CPU usage detected: {cpu_usage}%"
        log_message(message)
        print_alert(message)

Podana funkcja monitoruje aktualne wykorzystanie jednostki centralnej (CPU) w systemie. W przypadku, gdy wykorzystanie procesora przekroczy z góry określony próg wyrażony jako wartość procentowa, funkcja rejestruje powiadomienie oznaczające podwyższone wykorzystanie procesora i wyświetla komunikat alarmowy na ekranie.

Monitorowanie wykorzystania pamięci

Niniejszy wynalazek zapewnia ponadto mechanizm monitorowania wykorzystania pamięci poprzez implementację dodatkowej funkcji. Regularne śledzenie wykorzystania pamięci umożliwia wykrywanie wycieków pamięci, identyfikację procesów wymagających dużej ilości zasobów oraz ujawnianie potencjalnych wąskich gardeł. Dzięki takiemu podejściu możliwe jest zapobieganie spowolnieniom systemu, awariom i przestojom wynikającym z nadmiernego zużycia pamięci lub nieefektywnego wykorzystania zasobów.

 def check_memory_usage(threshold=80):
    memory_usage = psutil.virtual_memory().percent

    if memory_usage > threshold:
        message = f"High memory usage detected: {memory_usage}%"
        log_message(message)
        print_alert(message)

W sposób porównywalny do monitorowania wykorzystania procesora, ustalany jest z góry określony próg dla podwyższonych poziomów zużycia pamięci. Za każdym razem, gdy akumulacja pamięci osiągnie lub przekroczy ten poziom odniesienia, generuje zapis takiego zdarzenia i emituje powiadomienie do przeglądu.

Monitorowanie przestrzeni dyskowej

Należy zaimplementować funkcję narzędziową, aby konsekwentnie oceniać pozostałą przestrzeń dyskową.Dzięki bieżącej obserwacji dostępnej przestrzeni dyskowej można ograniczyć ewentualne komplikacje wynikające z niewystarczających zasobów. Niewystarczająca ilość miejsca na dysku może prowadzić do nieprawidłowego działania systemu, uszkodzenia informacji i zakłóceń w świadczeniu usług. Okresowe oceny przestrzeni dyskowej zapewniają utrzymanie wystarczającej pojemności pamięci masowej.

 def check_disk_space(path='/', threshold=75):
    disk_usage = psutil.disk_usage(path).percent

    if disk_usage > threshold:
        message = f"Low disk space detected: {disk_usage}%"
        log_message(message)
        print_alert(message)

Niniejsza funkcja sprawdza przydzieloną przestrzeń dyskową powiązaną z wyznaczoną ścieżką plików. Domyślnie oceniana lokalizacja obejmuje katalog główny reprezentowany przez reprezentację symboliczną “/”. W przypadku, gdy ilość dostępnego miejsca w tym obszarze zmniejszy się do z góry określonego poziomu, system generuje zarówno wpis w dzienniku, jak i emituje dźwiękowe powiadomienie ostrzegawcze.

Monitorowanie ruchu sieciowego

Wbudowanie funkcji nadzorującej strumień danych systemu w celu wczesnej identyfikacji potencjalnych anomalii w aktywności sieciowej. Takie odchylenia mogą oznaczać naruszenia bezpieczeństwa lub rozbieżności techniczne i mogą ułatwić szybkie podjęcie działań naprawczych.

 def check_network_traffic(threshold=100 * 1024 * 1024):
    network_traffic = psutil.net_io_counters().bytes_recv \\+\
                      psutil.net_io_counters().bytes_sent

    if network_traffic > threshold:
        message = f"High network traffic detected: {network_traffic:.2f} MB"
        log_message(message)
        print_alert(message)

Wyżej wymieniona funkcja śledzi aktywność sieciową, obliczając łączną ilość bajtów przesłanych i odebranych. Metryka ta jest wyrażona w bajtach. W przypadku, gdy natężenie ruchu sieciowego przekroczy ten wstępnie zdefiniowany limit, wygeneruje wpis w dzienniku i wyświetli powiadomienie wskazujące na takie zdarzenie.

Wdrażanie logiki monitorowania

Włączenie tych funkcji sprawdzania kondycji w ramach wyznaczonej funkcji kontrolera jest skutecznym podejściem. Wykonywanie ich sekwencyjnie pozwala na drukowanie odpowiednich informacji i rejestrowanie komunikatów podczas każdej iteracji procesu kompleksowej oceny.

 # Function to run health checks
def run_health_checks():
    print("Monitoring the system...")
    log_message("Running system health checks...")

    check_cpu_usage()
    check_memory_usage()
    check_disk_space()
    check_network_traffic()

    log_message("Health checks completed.")

Ta konkretna operacja przeprowadza zagregowaną ocenę ogólnej kondycji infrastruktury, wykonując wiele kontroli stanu w spójny i kompleksowy sposób, przedstawiając skonsolidowany przegląd bieżącego stanu witalności systemu.

Planowanie automatycznych kontroli i uruchamianie programu

Aby ułatwić automatyczne monitorowanie w określonych ramach czasowych, należy skorzystać z biblioteki Schedule. Pozwala to na elastyczność w ustawianiu częstotliwości aktualizacji zgodnie z wymaganiami.

 # Schedule health checks to run every minute
 schedule.every(1).minutes.do(run_health_checks)

Aby stale monitorować wydajność komputera, konieczne jest ciągłe wykonywanie procesu monitorowania systemu.

 # Main loop to run scheduled tasks
while True:
    schedule.run_pending()
    time.sleep(1)

Wspomniana pętla wytrwale sprawdza zaplanowane obowiązki i wykonuje je w określonych odstępach czasu.Po uruchomieniu oprogramowania na wyświetlaczu pojawią się następujące wyniki:

Oprogramowanie prowadzi dziennik swoich działań monitorujących w pliku system\_monitor.log, jednocześnie generując alert wyświetlany w interfejsie wiersza poleceń.

Zaawansowany program do monitorowania systemu

Psutil zapewnia dodatkowe możliwości monitorowania poza wymienionymi tutaj, umożliwiając dostosowanie do konkretnych potrzeb i preferencji.

Jednym z możliwych sposobów zwiększenia funkcjonalności funkcji raportowania jest włączenie systemu powiadomień e-mail, zamiast zwykłego wyświetlania komunikatów w interfejsie wiersza poleceń. Umożliwiłoby to użytkownikom otrzymywanie w czasie rzeczywistym aktualizacji i alertów dotyczących wydajności ich witryny bezpośrednio w ich skrzynkach odbiorczych, ułatwiając im monitorowanie i rozwiązywanie wszelkich problemów, które mogą się pojawić.