Słownik AI

Wiedza dziedzinowa – ang. Domain Knowledge, DK

Wiedza dziedzinowa w AI – definicja i zastosowania

Czym jest Wiedza dziedzinowa (Domain Knowledge)?

Wiedza dziedzinowa to zestaw ugruntowanych pojęć, zależności i reguł opisujących wycinek rzeczywistości, który ma zostać odwzorowany lub wsparty przez system informatyczny. W projektach wykorzystujących uczenie maszynowe pojęcie to obejmuje zarówno przepisy prawa w module compliance, jak i warunki fizyczne w symulacji materiałów. Od lat siedemdziesiątych, gdy powstał medyczny system ekspertowy MYCIN na Uniwersytecie Stanforda, badacze podkreślają, że nawet najbardziej zaawansowany algorytm pozostaje narzędziem, dopóki nie otrzyma treści merytorycznej od praktyków.

Jak dokładnie działa Wiedza dziedzinowa (Domain Knowledge)

Proces inkorporowania wiedzy zaczyna się od jej pozyskania: wywiadów z ekspertami, analizy dokumentacji lub ekstrakcji informacji z korpusów tekstu. Kolejnym krokiem jest formalizacja, czyli przekształcenie nieustrukturyzowanych opisów w ontologie, bazy reguł lub dodatkowe cechy wejściowe modelu. W wersji hybrydowej inżynierowie mogą na przykład wzbogacić sieć neuronową o warstwę wymuszającą zachowanie znanych praw termodynamicznych. Tak przygotowana reprezentacja trafia do etapu uczenia albo do mechanizmu wnioskowania, co zapewnia spójność przewidywań z rzeczywistością branżową.

Zastosowania w praktyce

Na oddziale intensywnej terapii model przewidujący ryzyko sepsy korzysta z bogatej bazy reguł klinicznych i dopiero wokół niej buduje część statystyczną, co pozwala wychwycić rzadkie przypadki nieujęte w danych historycznych. W finansach podobną rolę pełni system antyfraudowy, w którym wiedza analityków o typowych ścieżkach prania pieniędzy uzupełnia klasyfikator transakcji oparty na uczeniu głębokim. W obu scenariuszach wartość dodana polega na zmniejszeniu liczby fałszywych alarmów.

Zalety i ograniczenia

Kluczową zaletą jest przejrzystość: reguły i ontologie są zrozumiałe dla ekspertów biznesowych, a więc łatwo je audytować. Kolejnym atutem bywa odporność na zjawisko «danych z innej dziedziny», ponieważ model ma zakotwiczenie w sprawdzonych prawach. Z drugiej strony ręczne pozyskanie wiedzy jest czasochłonne i podatne na lukę poznawczą – eksperci nie zawsze precyzyjnie artykułują nieuświadomione praktyki. Istnieje też ryzyko zbytniego usztywnienia algorytmu, przez co traci on elastyczność w obliczu nowości.

Na co uważać?

Nadmierne zaufanie do autorytetów bywa ryzykowne, zwłaszcza gdy model ma działać w środowisku dynamicznie zmieniających się danych. Warto ustanowić proces regularnej walidacji wiedzy dziedzinowej z udziałem świeżych przykładów oraz testów kontradyktoryjnych. Kolejnym wyzwaniem jest konflikt między regułami a statystyką – w takiej sytuacji projektant powinien jasno określić priorytety, aby uniknąć niespójnych wyników.

Dodatkowe źródła

Osoby zainteresowane formalnymi aspektami mogą sięgnąć do klasycznej pracy „Building Expert Systems” Edwarda Feigenbauma. Praktyczne przykłady integracji reguł z głębokimi sieciami opisuje raport arXiv:2002.00837. Wprowadzenie do ontologii dostępne jest w artykule na Wikipedii, a zwięzłe omówienie modeli hybrydowych AiOps można znaleźć w publikacji arXiv:2108.11479.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *