CW5.PDF

(198 KB) Pobierz
Microsoft Word - MOPP07P00D45-010.doc
Katedra
Podstaw
Konstrukcji
Maszyn
Wydział
Mechaniczny
Technologiczny
Metody Sztucznej
Inteligencji
Politechnika
Śląska
Kierunek studiów MiBM, semestr 4
Prowadzący przedmiot
dr hab. inż. Anna Timofiejczuk
Rok akademicki 2001/02
Instrukcja do ćwiczeń laboratoryjnych
Ćwiczenie 5
Temat
Sieci Bayesowskie
Opracował: mgrinż. Marcin Bednarski
ul. Konarskiego 18a
44-100 Gliwice
tel. 237 1467
fax 237 1360
http://kpkm.mt.polsl.gliwice.pl
MOPP07P00D45-010
Gliwice 2002-04-15
- 1/9-
1. Cel ćwiczenia
Celem ćwiczenia jest zapoznanie się z zagadnieniami modelowania z zastosowaniem
sieci bayesowskich i nabycie praktycznych umiejętności definiowania i stosowania tych
sieci. W ramach ćwiczeń stosowane będzie oprogramowanie NETICA, którego wersja
demonstracyjna (wystarczająca do przeprowadzenia ćwiczenia) jest dostępna poprzez
witrynę http://www.norsys.com/ wybierając „Downloads” i „Netica”.
2. Wprowadzenie
2.1. Twierdzenie Bayesa
Prawdopodobieństwa warunkowe służą do wyrażania zależności między zdarzeniami.
Prawdopodobieństwo zajścia zdarzenia A wtedy gdy zaszło zdarzenie B , definiuje się
dla dowolnych zdarzeń A,B
(gdzie
P(
A
|
B
)
P(
A
,
B
)
P(
B
)
gdzie P( A | B ) oznacza prawdopodobieństwo łącznego zajścia zdarzeń A i B
Z prawdopodobieństwem warunkowym wiąże się wzór Bayesa 1 :
P(
A
|
B
)
P(
A
)
P(
B
|
A
P(
B
)
2.2. Sieć bayesowska
Sieć bayesowska to acykliczny (nie zawierający cykli) graf skierowany w którym węzły
reprezentują zmienne (np. temperaturę jakiegoś źródła, stan pacjenta, cechę obiektu
itp.) a skierowane gałęzie informacyjną lub przyczynową zależność pomiędzy tymi
zmiennymi. Zależność ta jest określona przez warunkowe prawdopodobieństwo, które
jest przypisane do każdego połączenia pomiędzy węzłami w sieci. Zmienne
reprezentowane przez węzły przyjmują wartości dyskretne (np.: TAK, NIE). Rysunek 1
przedstawia prostą sieć bayesowską. Opisuje ona relacje przyczynowe pomiędzy
wystąpieniem zachmurzenia i zraszaniem trawy, pomiędzy wystąpieniem zachmurzenia
a wystąpieniem deszczu i pomiędzy zraszaniem trawy, i wystąpieniem deszczu a mokrą
trawą. Obok każdego węzła przedstawiono tablicę prawdopodobieństw warunkowych
np. dla węzła D prawdopodobieństwo, że działał zraszacz ( B =T), nie padał deszcz
( C =N) i trawa jest mokra ( D =T) jest równe 0,9 (drugi wiersz).
1
MOPP07P00D45-010
Gliwice 2002-04-15
- 2/9-
- zbiór zdarzeń elementarnych), przy
założeniu, że P( B )>0, jako prawdopodobieństwo warunkowe
)
Thomas Bayes (1702-1761) – angielski matematyk
44749246.004.png
A =T A =N
0,5 0,5
Występuje
zachmurzenie
A
A =T B =N
T ,1 ,9
N
0,5
A =T C =N
T ,8 ,2
N ,2 ,8
Działał
zraszacz
B
B C D =T D =N
T T 0,99 0,01
TN ,9 ,1
NT ,9 ,1
N N
Padał
deszcz
C
0,0 .0
C =T E =N
T ,00
N
Trawa jest
mokra
D
Dach jest mokry
E
Rys. 1. Przykładowa sieć bayesowska, zmodyfikowany przykład pokazany w [3]
2.3. Konstruowanie sieci bayesowskiej
Aby wnioskować na podstawie danych należy najpierw stworzyć sieć bayesowska.
Generalnie stworzenie takiej sieci wymaga pomocy eksperta z dziedziny, której dotyczy
tworzony model, w celu określenia właściwych zależności przyczynowych i
prawdopodobieństw warunkowych. Do budowania sieci bayesowskiej możliwe jest
również zastosowanie technik uczenia. Większość oprogramowania komputerowego
dotyczącego tworzenia sieci bayesowskich pozwala na podstawie danych trenujących
wyznaczyć odpowiednie parametry sieci (warunkowe rozkłady prawdopodobieństwa).
Istnieją również bardziej złożone programy komputerowe pozwalające wyznaczyć
związki przyczynowe pomiędzy zmiennymi (strukturę sieci).
Kolejne kroki tworzenia sieci bayesowskiej (bez użycia danych trenujących) i jej
stosowanie:
zdefiniowanie zmiennych,
zdefiniowanie połączeń pomiędzy zmiennymi,
określenie prawdopodobieństw warunkowych i „a priori 2 ”,
wprowadzenie do sieci danych,
uaktualnienie sieci,
2 „a priori” - (z łaciny - z założenia) - niezależne od doświadczenia, zdobyte na podstawie rozumowania,
intuicję itp.
MOPP07P00D45-010
Gliwice 2002-04-15
- 3/9-
0,5
0,01 0,99
44749246.005.png
 
wyznaczenieprawdopodobieństw „a posteriori 3 ”.
2.4. Przykład wnioskowania za pomocą sieci
Siec przedstawioną na rys.1 będziemy rozpatrywać dla trzech sytuacji :
1) nie wiemy nic tzn. nie wiemy czy wystąpiło zachmurzenie, czy padał deszcz, czy
działał zraszacz i czy trawa jest mokra,
2) wiemy, że trawa jest mokra,
3) wiemy, że występuje zachmurzenie oraz trawa jest mokra.
Rysunki 2,3,4 przedstawiają odpowiednio rozkłady prawdopodobieństw (określone w
procentach) w każdym węźle.
Rys. 2. Rozkłady prawdopodobieństwa dla sytuacji 1 („nie wiemy nic”).
Rys. 3. Rozkłady prawdopodobieństwa dla sytuacji 2 („wiemy, że trawa jest mokra”).
Z porównania rysunku 3 i 2 wynika, że wiadomość o tym iż trawa jest mokra pozwala
zwiększyć nasze przekonanie o tym, że padał deszcz (z 50% do 70%) oraz o tym, że
działał zraszacz (z 30% do 43%).
„a posteriori” (z łaciny - z następstwa) - uzyskane na podstawie doświadczenia
MOPP07P00D45-010
Gliwice 2002-04-15
- 4/9-
3
44749246.006.png 44749246.001.png
Rys. 4. Rozkłady prawdopodobieństwa dla sytuacji 3 (wiemy, że występuje
zachmurzenie i trawa jest mokra).
Z porównania rysunków 4 i 3 wynika, że dodatkowa wiadomość o tym iż występuje
zachmurzenie pozwala zwiększyć przekonanie, że padał deszcz (z 70% do 97,6%) oraz
znacznie zmniejszyć przekonanie o tym, że działał zraszacz (z 42% do 13%).
Gdybyśmy ponadto w kolejnym kroku stwierdzili, że zraszacz nie działa (rys.6) to nasze
przekonanie, że padał deszcz wzrasta do 100%.
2.5. Warunkowa niezależność węzłów sieci bayesa
Rozważając przypadek przedstawiony na rys.1, możemy przypuszczać, że węzły B i C
są niezależne od siebie. Lecz w przypadku gdy wiemy, że trawa jest mokra intuicyjnie
można stwierdzić ż istnieje zależność pomiędzy węzłem B i C – większe
prawdopodobieństwo tego, że padał deszcz zmniejsza prawdopodobieństwo tego, że
działał zraszacz i na odwrót.
Dwa (zbiory) węzły Q i R są warunkowo niezależne jeżeli nie istnieje ani jedna ścieżka
bezpośrednio łącząca ( d-connecting path ) Q i R. Ścieżka pomiędzy Q i R jest
bezpośrednio łączącą ( d-connecting ) jeśli każdy wewnętrzny węzeł N ścieżki ma
następujące własności:
jestzbiegający się i albo on albo jeden z jego potomków jest dany.
Q
N
Q
R
N
R
N
Q
R
liniowy
zbiegający się
rozchodzący się
MOPP07P00D45-010
Gliwice 2002-04-15
- 5/9-
jest liniowy lub rozchodzący się i nie jest dany
44749246.002.png 44749246.003.png
Zgłoś jeśli naruszono regulamin