Statisztikai adatok jellemzése

1.) A statisztikában az adatok jellemzésének egyik fontos szempontja az adatok átlagának (számtani közepének) kiszámítása.

A diákok legtöbbje kiszámolja a tantárgyi eredményeinek átlagát. Persze ugyanezt a tanárok is megteszik.
Az átlag egy fontos jellemzője lehet egy adott teljesítménynek.

Egy számsokaság átlaga úgy kapható meg, hogy az adatokat összeadjuk és az összeget elosztjuk az adatok számával.  Az átlag tehát a adatok számtani közepe.

Az “a” adatsokaság átlagának a jele: Jelölés: ​\( \overline{a} \)​.

Átlag kiszámításának képlete tehát: ​\( \overline{a}=\frac{a_{1}+a_{2}+a_{3}+…+a_{n}}{n} \)​.

Rövidebben: ​\( \overline{a}=\frac{\sum_{i=1}^{n}{ }a_{i}}{n} \)

Persze az átlag kiszámításánál gyorsabban is eljárhatunk, ha az egyes adatok gyakoriságát is figyelembe vesszük.

Az alábbi táblázat egy 20 fős tanuló csoport dolgozatainak eredményeit mutatja a gyakoriság figyelembe vételével:

Gyakoriság Relatív gyakoriság
5 2 fő 10%
4 5 fő 25%
3 6 fő 30%
2 3 fő 15%
1 4 fő 20%
Összesen: 20 fő 100%

Az átlag kiszámítása a fenti példa esetén a gyakoriság figyelembe vételével: (2⋅5+5⋅4+6⋅3+3⋅2+4⋅1)/20=2.9.

Egy adott adatsokaság (a1, a2;a3,…,an) átlagának kiszámítására a statisztikában alkalmazott a képlet  a gyakoriság figyelembe vételével:

Átlag: ​\( \overline{a}=\frac{gy_{1}·a_{1}+gy_{2}·a_{2}+…+gy_{n}·a_{n}}{gy_{1}+gy_{2}+…gy_{n}} \)​.
Itt az egyes adatok gyakoriságát, előfordulásainak a számát gyi jelöli.

Amennyiben a gyakoriság (gyi) helyett a relatív gyakorisággal (rgyi) számolunk, akkor a képlet így alakul:

\( \overline{a}=rgy_{1}·a_{1}+rgy_{2}·a_{2}+…+rgy_{n}·a_{n} \)​.

A statisztikában alkalmazott átlagnak a valószínűségszámításban a várható érték felel meg.

Az átlag csak egy szempont lehet egy tanuló teljesítményének a megítélésében:

Például: Tételezzük fel, hogy a következő négy tanulónak 5-5 db. osztályzata volt az elmúlt időszakban:

1. tanuló: 3; 3; 3; 3 ;3. 2. tanuló: 1; 2; 3; 4; 5. 3. tanuló: 5; 4; 3; 2; 1. 4. tanuló: 1; 5; 3;4; 2.

Mindegyik tanuló átlaga ugyanannyi, 3-as. Mégis, az egyes tanulók teljesítménye nagyon is különbözik egymástól.

Ezekhez a tanulókhoz, a teljesítményükhöz a következő jelzők társulhatnak: kiegyensúlyozott, fokozatosan javuló, hanyatló, hullámzó.

2.) Az adatsokaságok egy másik fontos jellemzője lehet, hogy melyik adat fordul elő a legtöbbször. Ez a jellemző az un. módusz.

Definíció:

Egy számsokaság módusza az adathalmazban leggyakrabban előforduló érték.

A fenti példa módusza a 3-as osztályzat, mert ennek a gyakorisága a legtöbb (6 fő).

A módusz csak akkor lehet jellemző, ha van egy vagy két olyan adat, amelyiknek a gyakorisága a többiekéhez képest jelentősen magasabb.

Beszélhetünk több móduszú adatsokaságról, ha egynél több (két – három) adat gyakorisága ugyanannyi, de az is lehet, hogy agy adott adathalmaznak nincs módusza.

3.) Az adatsokaságok egy további jellemzője a medián, a középső adat.

Definíció:

Egy számsokaság mediánja a adathalmaz nagyság szerinti sorrendjében a középső adat. Ha az adatok elemszáma páros (2n), akkor a két középső (n és n+1.) adat számtani közepe a medián értéke.

A fenti 20 elemű példa mediánja is a 3-as osztályzat, hiszen az érdemjegyek nagyság szerinti sorrendjében a 10. és a 11. helyen is 3-as osztályzat szerepel.

A fenti három jellemzőt közös néven középértékeknek is hívjuk.

4.) Az adatsokaságok adatainak az átlagtól való ingadozását méri az adatok szórása.

Képlettel: ​\( D(\overline{a})=\sqrt{\frac{(a_{1}-\overline{a})^2+(a_{2}-\overline{a})^2+…+(a_{n}-\overline{a})^2}{n}} \)

A szórás kiszámításának lépései:

  1. Az átlag kiszámítása.
  2. Az egyes adatoknak az átlagtól való eltérése. (Ez előjeles érték is lehet.)
  3. Az eltérések négyzetét vesszük.
  4. Az eltérések négyzeteit átlagoljuk. Ez a variancia.
  5. A szórás a variancia értékének négyzetgyöke.

Nézzük most ezt a fenti példán:
A gyakoriság alkalmazásával a következőképen végezhető el a számítás:

Jegy (ai) Gyakoriság
(gyi)
Átlagtól való eltérés ai-​\( \overline{a} \) Négyzetre emelve  (ai-​\( \overline{a} \)​)2 Gyakorisággal szorozva gyi⋅(ai-​\( \overline{a} \)​)2
5 2 2,1 4,41 8,82
4 5 1,1 1,21 6,05
3 6 0,1 0,01 0,06
2 3 -0,9 0,81 2,43
1 4 -1,9 3,61 14,44
Átlag (​\( \overline{a} \)​): 2,9 Variancia: 1,59
Szórás: 1,26

Képlettel:

Átlag: ​\( \overline{a}=\frac{gy_{1}·a_{1}+gy_{2}·a_{2}+…+gy_{n}·a_{n}}{gy_{1}+gy_{2}+…gy_{n}} \)​.

Szórás: ​\( D(\overline{a})=\sqrt{\frac{gy_{1}·(a_{1}-\overline{a})^2+gy_{2}·(a_{2}-\overline{a})^2+…+gy_{n}·(a_{n}-\overline{a})^2}{gy_{1}+gy_{2}+…gy_{n}}} \)​.

Persze, ma már több szoftver, így a táblázatkezelő programok is tartalmazzák beépített függvényként a szórás kiszámítását.

 

Print Friendly, PDF & Email

Comments are closed, but trackbacks and pingbacks are open.