Czym jest Przyczynowość (Causality)?
Przyczynowość opisuje relację, w której jedna zmienna wywołuje zmianę w innej, a nie jedynie z nią współwystępuje. W analizie danych i metodach uczenia maszynowego wprowadza formalny aparat pozwalający odróżnić korelację od wpływu przyczynowego. Koncepcję osadzono w pracach statystycznych Ronalda Fishera z lat 20. XX wieku, jednak współczesne ujęcie opracowali Donald Rubin (model potencjalnych wyników) i Judea Pearl, który w 1995 roku zaproponował grafy przyczynowe oraz Structural Causal Model.
Jak dokładnie działa Przyczynowość (Causality)
W praktyce buduje się skierowane akyliczne grafy (DAG), w których węzły odpowiadają zmiennym, a krawędzie – kierunkom wpływu. Model wyraża się równaniami strukturalnymi, co umożliwia symulowanie interwencji typu do(X = x). Algorytmicznie można korzystać z metod takich jak PC Algorithm, GES czy uczenie zmiennych ukrytych przez Invariant Risk Minimization. W odróżnieniu od klasycznych sieci neuronowych, które jedynie odwzorowują zależności statystyczne, modele przyczynowe potrafią odpowiadać na pytania kontrfaktyczne: „Co by było, gdyby cecha X miała inną wartość?”.
Zastosowania w praktyce
W medycynie przyczynowość umożliwia ocenę skuteczności terapii, gdy randomizowane badania są zbyt kosztowne lub etycznie wątpliwe. W marketingu pozwala prognozować wpływ kampanii na sprzedaż, eliminując mylące czynniki sezonowe. W systemach rekomendacyjnych można symulować, jak usunięcie biasu popularności zmieni prawdopodobieństwo kliknięcia. Firmy technologiczne, takie jak Microsoft Research (projekt DoWhy, 2019), udostępniają biblioteki, które integrują wnioski przyczynowe z pipeline’em ML.
Zalety i ograniczenia
Największą korzyścią jest zdolność przenoszenia wniosków na nowe konteksty – jeśli relacja przyczynowa jest trafnie uchwycona, model zachowuje się stabilnie przy zmianie rozkładu danych. Ograniczeniem pozostaje trudność prawidłowego określenia grafu, zwłaszcza gdy dostępne są tylko obserwacje pasywne. Niepoprawne założenia mogą prowadzić do paradoksu Simpsona oraz błędnych rekomendacji polityk.
Na co uważać?
Należy zwracać uwagę na niewystarczające pokrycie danych, ukryte zmienne i wybór zmiennych instrumentalnych. Wnioskowanie przyczynowe wymaga również walidacji eksperymentalnej, dlatego łączy się je często z testami A/B. Modele wyłącznie statystyczne mogą wydawać się trafniejsze na zbiorze testowym, ale zawodzą w środowisku zmiennym; z kolei modele przyczynowe bywają mniej dokładne punktowo, lecz oferują większą interpretowalność.
Dodatkowe źródła
Więcej informacji można znaleźć na stronach: Wikipedia – Causal inference, w monografii Judea Pearla „Causality: Models, Reasoning, and Inference” oraz w pracy arXiv:1702.02604 – Counterfactual Regret Minimization. Praktyczne przykłady wraz z kodem oferuje repozytorium DoWhy.


