Bayes tétele

Példa:

Hazánkban a népesség 4%-a cukorbeteg. Egy nem teljesen pontos teszt szolgál a betegség felismerésére. A teszt a cukorbetegek 95%-ánál ad pozitív jelzést de ugyanakkor az egészségesek (nem cukorbetegek) 2%-ánál is pozitív jelzést ad.
1. Mennyi a valószínűsége, hogy a teszt pozitív jelzést ad?
2. Mennyi a valószínűsége, hogy a teszt pozitív, de a személy egészséges?

(Gyakorló és érettségire felkészítő feladatgyűjtemény II. 1651. feladat)

Megoldás:

Az adatok értelmezése.

A feladat és az összefüggések jobb megértése és követhetősége érdekében számszerűsítsük is a megadott adatokat.

Legyen az ország lakosainak a száma 10 millió fő (107 fő).
Ekkor a cukorbetegek száma: 400000 fő (4⋅105 fő).
Nem cukorbetegek száma: 9600000 fő (9.6⋅106 fő).

Vezessük be a következő jelöléseket:

C esemény: {cukorbeteg a választott}. P(C) = 0.04.
E esemény:{egészséges a választott}. P(E)=0.96 E=​\( \overline{C} \)​.

A esemény: {A teszt pozitív jelzést ad}.
T esemény: {Téved a teszt}.

Mit jelent az a mondat, hogy „A teszt a cukorbetegek 95%-nál ad pozitív jelzést ad.” ?
Ez azt jelenti, hogy 4⋅105⋅0,95=3,8⋅105=380 000 embernél helyesen ad pozitív jelzést.
Ez az A|C  esemény jelentése. „A|C” esemény: {Pozitív jelzést kaptunk, feltéve, hogy a választott cukorbeteg volt}. Ennek valószínűsége: P(A|C)=0,95=​\( \frac{380000}{400000} \)​.

Mit jelent az a mondat, hogy „ugyanakkor az egészségesek (nem cukorbetegek) 2%-ánál is pozitív jelzést ad” ? Ez azt jelenti, hogy   9,6⋅106⋅0,02=1,92⋅105 esetben helytelenül ad pozitív jelzést.
Ez az „A|E” esemény. Az „A|E” esemény:{Pozitív jelzést kaptunk, bár a választott nem volt cukorbeteg}. Ennek valószínűsége: P(A|E)=0,02=​\( \frac{1,92·10^5}{9,6·10^6} \)​.

Az első kérdés a következő volt:

a)Mennyi a valószínűsége, hogy a teszt pozitív jelzést ad?

Mivel a „C” és az „E” események kizárják egymást, ezért alkalmazhatjuk a teljes valószínűség tételét!

P(A)=P(A|C)⋅P(C)+P(A|E)⋅P(E)
P(A)=0,95⋅0,04+0,02⋅0,96=0,0572.

Nézzük ezt a létszám adatokkal: Pozitív jelzést kaptunk helyesen 380000 embernél és hibásan 192000 fő esetén. Ez összesen = 572000 esetet jelent.

P(A)=​\( \frac{572000}{1000000} \)​=0,0572.

Tehát annak a valószínűsége, hogy a teszt pozitív eredményt ad, függetlenül attól, hogy cukorbeteget vizsgáltunk, vagy sem: 0.0572.

Mit is jelent a második kérdés:

„Mennyi a valószínűsége annak, hogy a teszt pozitív, de a személy egészséges”?

Az „A|E” esemény „fordítottjáról”, a E|A” esemény valószínűségéről szól ez a kérdés.
Az „A|E” esemény:{Pozitív jelzést kaptunk, bár a választott egészséges volt}
Az „E|A” esemény:{Egészséges ember a választott, feltéve, hogy pozitív jelzést kaptunk}.
Mivel ismerjük a P(A|E) esemény, az „E” esemény és az „A” esemény valószínűségét, olyan összefüggésre van szükségünk, amelyik ezek felhasználásával az „E|A” esemény valószínűségének kiszámítását adja. Ennek megválaszolásában segít az un. Bayes-tétel:

\( P(E|A)=\frac{P(A|E)⋅P(E)}{P(A)} \)​.
\( P(E|A)=\frac{0,02⋅0,96}{0,0572} \)=0,3357​. Ami kb. 33,6%-t jelent.

A fenti szám első pillanatra soknak tűnik. De nézzük ezt meg létszám adatokkal is.
Tudjuk, hogy 572000 embernél jelzett a pozitív értéket, de 192000 esetben ezt egészséges embernél teszi. Ezért annak a valószínűsége, hogy a pozitív esetek hány százalékában nem cukorbetegről van szó, az „E|A” esemény valószínűsége: P(E|A)=​\( \frac{192000}{572000} \)​≈0,3357

Azaz a pozitív jelzésű esetek kb. 1/3-d része egészségeseknél történt.

Megjegyzés:

Az „A|E” esemény valószínűsége az egészségesek számához viszonyítja a pozitív tesztek számát míg az „E|A” esemény valószínűsége a pozitív jelzésű esetek számához azok számát akik ezek közül egészségesek. A Bayes-tétel pont az ilyen esetekben használható.

A feltételes valószínűség definíciója szerint: ⋅P(A|E)=​\( \frac{P(A⋅E)}{P(E)} \)​.

Átszorozva: P(A|E)⋅P(E)=P(A⋅E).

Viszont ugyancsak a feltételes valószínűség definíciója szerint: ⋅P(E|A)=​\( \frac{P(A⋅E)}{P(A)} \)​.

A számlálóba behelyettesítjük az „A⋅E” esemény valószínűségére kapott alakot:

\( P(E|A)=\frac{P(A|E)⋅P(E)}{P(A)} \)

A Bayes-tétel a valószínűségszámításban egy feltételes valószínűség és a fordítottja között állít fel kapcsolatot.

Bayes-tétel általánosságban:

Legyen „H” egy eseménytér B1; B2; …Bn olyan teljes eseményrendszere, amely egyetlen eseményének a valószínűsége sem nulla. Legyen „A” a „H” eseménytér egy tetszőleges eseménye. Ekkor:

\( P(B_{i}|A)=\frac{P(A|B_{i})·P(B_{i})}{P(A|B_{1})·P(B_{1})+P(A|B_{2})·P(B_{2})+…+P(A|B_{n})·P(B_{n})} \)​.

Itt a nevezőben a teljes valószínűség tételét látjuk.

Egyszerűbb esetben:​\( P(B|A)=\frac{P(A|B)·P(B)}{P(A)} \)​.

Vagy másképp: \( P(B|A)=\frac{P(A|B)·P(B)}{P(A|B)·P(B)+P(A|\overline{B})·P(\overline{B})} \)​.

A Bayes-tétel azt mutatja meg, hogyan kell (lehet) egy kísérlet előtti véleményünket a mintavétel után elfogadni vagy megváltoztatni.

Példa:

Egy forgácsoló üzemben készült munkadarabok 96%-a felel meg a súlyszabványnak. A minőségellenőrzés során az elkészült munkadarabok egy részét megvizsgálják. A súly szempontjából a szabványos darabok 98%-a bizonyul jónak, a nem szabványos súlyú darabokból pedig 5%-ot nyilvánítanak alakra jónak.
Mennyi a valószínűsége annak, hogy egy darab, amely a minőségellenőrzésen alakra jónak bizonyul, az megfelel a súlyszabványnak is?

Solt György Valószínűségszámítás 149. oldal

Megoldás:

Az adatok értelmezése.

A” esemény: {egy munkadarab jónak alakra jónak bizonyul a minőségellenőrzésen}-
B” esemény: {a vizsgált darab súlya szabványos}
„​\( \overline{B} \)​” esemény: { A vizsgált darab súlya nem szabványos}.

Természetesen B +\( \overline{B} \)​=H, azaz  együtt teljes eseményrendszert alkotnak.

A megadott adatokból következő valószínűségek:P(B)=0.96, és P(\( \overline{B} \))=0,04.

Az „A” esemény B illetve \( \overline{B} \) esemény melletti feltételes valószínűsége: P(A|B)= 0,98 és P(A|\( \overline{B} )\)=0,05.

A  feladat a B esemény valószínűségének a meghatározását kívánja az A esemény teljesülése esetén,azaz a P(B|A) értéke a kérdés. Ezt a feltételes  valószínűséget a Bayes-tétel segítségével számíthatjuk ki: ​\( P(B|A)=\frac{P(A|B)·P(B)}{P(A|B)·P(B)+P(A|\overline{B})·P(\overline{B})} \)​.

Azaz: ​\( P(B|A)=\frac{0,98·0,96}{0,98·0,96+0,05·0,04}=\frac{0,9408}{0,9428}≈0,998. \)​.

Ez azt jelenti, hogy kb. 99,8% a valószínűsége annak, hogy a minőségellenőrzésen alakra jónak bizonyult darab súlya megfelel a szabványnak.

Bayes, Thomas

Comments are closed, but trackbacks and pingbacks are open.