Słownik AI

Sieć bayesowska – ang. Bayesian network, BN

Sieć bayesowska (Bayesian network) – definicja i zastosowania

Czym jest Sieć bayesowska (Bayesian network)?

Sieć bayesowska, często zapisywana skrótem BN, to skierowany, acykliczny graf opisujący zależności probabilistyczne pomiędzy zmiennymi losowymi. Struktura odpowiada zbiorowi węzłów reprezentujących zmienne oraz krawędzi wskazujących kierunek zależności przyczynowo-skutkowych. Każdy węzeł posiada tabelę rozkładów warunkowych, dzięki czemu całość umożliwia obliczanie prawdopodobieństw wystąpienia zdarzeń przy częściowo znanych danych wejściowych.

Krótki kontekst historyczny

Pojęcie sieci bayesowskiej zostało ugruntowane w latach 80. XX w. przez Judea Pearla z Uniwersytetu Kalifornijskiego w Los Angeles oraz pracującego równolegle Davida Heckaermana w Microsoft Research. Ich prace na temat wnioskowania probabilistycznego i algorytmów propagacji wiary pokazały, że modelowanie niepewności można ująć w ramy znacznie bardziej przebudowane niż wcześniejsze drzewo decyzyjne czy proste regresje logistyczne.

Jak dokładnie działa Sieć bayesowska (Bayesian network)

Rdzeniem działania jest twierdzenie Bayesa, które pozwala odwracać zależności przyczynowe i aktualizować wiedzę o zdarzeniach w świetle nowych informacji. W praktyce proces rozpoczyna się od zdefiniowania struktury grafu, a następnie oszacowania parametrów w tabelach prawdopodobieństw warunkowych. Podczas wnioskowania algorytmy, takie jak propagacja wiary (belief propagation) lub próbkowanie Monte Carlo, aktualizują rozkłady węzłów, gdy użytkownik wprowadza nowe obserwacje.

Zastosowania w praktyce

Sieci bayesowskie wspierają podejmowanie decyzji tam, gdzie dane są niekompletne albo obarczone błędem pomiaru. W diagnostyce medycznej model może wskazać najbardziej prawdopodobne schorzenia na podstawie zestawu objawów i wyników laboratoryjnych. W analizie ryzyka finansowego pomaga ocenić wpływ kilku współzależnych czynników – od kursów walut po opóźnienia w łańcuchu dostaw – na przyszłą płynność przedsiębiorstwa. W robotyce umożliwia planowanie ruchu w środowiskach o ograniczonej widoczności, a w biologii obliczeniowej wspiera rekonstrukcję sieci genowych z eksperymentów mikro-array.

Przykład zastosowania

Wyobraźmy sobie system asystenta serwisowego w lotnictwie. Węzły reprezentują elementy silnika, warunki pogodowe i pomiary czujników, a krawędzie opisują ich wpływ na ryzyko awarii. Gdy czujniki wykryją podwyższoną temperaturę, sieć bayesowska obliczy prawdopodobieństwo uszkodzenia łożyska oraz wskaże, które dodatkowe pomiary (np. wibracje) najbardziej zmniejszą niepewność diagnozy.

Zalety i ograniczenia

Najmocniejszą stroną sieci bayesowskich jest czytelna interpretacja zależności przyczynowych oraz zdolność łączenia wiedzy eksperckiej z danymi empirycznymi. W porównaniu z klasyczną regresją liniową BN lepiej radzi sobie z brakami danych i umożliwia wnioskowanie w obu kierunkach – od przyczyn do skutków i odwrotnie. Trzeba jednak pamiętać, że przy dużej liczbie węzłów przebudowa tabel rozkładów staje się obciążająca obliczeniowo, a nieprawidłowo wybrana struktura grafu może prowadzić do mylących wniosków.

Na co uważać?

Najczęstsze pułapki dotyczą błędnych założeń o niezależności warunkowej zmiennych oraz przeliczenia zbyt dużej liczby parametrów przy skromnym zbiorze treningowym. Aby ograniczyć te problemy, stosuje się regularizację, podejścia bayesowskie hierarchiczne lub łączy wyniki z analizą wrażliwości.

Dodatkowe źródła

Dla pogłębienia tematu warto sięgnąć do monografii „Probabilistic Reasoning in Intelligent Systems” autorstwa Judea Pearla oraz do przeglądowego artykułu dostępnego na arXiv. Wprowadzenie dla praktyków znajduje się również na Wikipedii. O algorytmach uczenia struktury można przeczytać w pracy „Learning Bayesian Networks” Thomasa Heckaermana, udostępnionej na stronie Microsoft Research.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *