Ako Sauga koduleht

Vabalt kasutatav ōkonomeetriapakett Gretl

Programmi kodulehekülg https://gretl.sourceforge.net

Kirjeldav statistika

Ühe või mitme tunnuse kirjeldava statistika näitajate leidmiseks valida põhimenüüst
View->Summary statistics

Alammenüüd

Plain: kirjeldav statistika üle kõikide objektide

Avanevas aknas paigutada rohelise noole abil paremasse kasti tunnus või tunnused, mille kirjeldava statistika näitajatega soovitakse tutvuda. Kui on märgitud Show all statistics, kuvatakse kõik kirjeldava statistika näitajad. Kui see märgitud pole, kuvatakse vaid aritmeetiline keskmine, miinimum, maksimum, standardhälve ning puuduvate vaatluste arv.


Kõik kuvatavad kirjeldava statistika suurused on järgmised:
  • Mean - aritmeetiline keskmine.
  • Median - mediaan.
  • Minimum - minimaalne väärtus.
  • Maximum - maksimaalne väärtus.
  • Standard deviation - valimi standardhälve.
  • C.V. - variatsioonikordaja (Coefficient of Variation) on valimi standardhälbe ja aritmeetilise keskmise suhe.
  • Skewness - asümmeetriakordaja. Positiivse asümmeetria korral on jaotuse saba paremal (arvtelje positiivses suunas), negatiivse jaotuse korral on saba vasakul. Sümmeetrilise jaotuse korral on asümmeetrikordaja 0.
  • Ex. kurtosis - püstakuse kordaja. Positiivne, kui jaotus on normaaljaotusest püstakam, ja negatiivne, kui jaotus on normaaljaotusest lamedam. Normaaljaotuse korral 0.
  • 5% percentile - 5% protsentiil (5% väärtustest on sellest väiksemad).
  • 95% percentile - 95% protsentiil (95% väärtustest on sellest väiksemad).
  • Interquartile range - kvartiilhaare (kolmanda ja esimese kvartiili vahe).
  • Missing obs. - puuduvate väärtuste arv.

Mitme tunnuse kirjeldava statistika kuvamisel on erinevate näitajate väärtused veergudes. Näeme, et kõige rohkem varieerub tunnus capital: selle variatsioonikordaja 1,7530 on kõige suurem.

Kirjeldavat statistikat saab vaadata ka, kasutades tunnuse nime peal hiire parempoolse klahvi abil avatavat hüpikmenüüd, valides Summary statistics. Mitme tunnuse kirjeldava statistika vaatamiseks valida enne vastavad tunnused välja.

Factorized: kirjeldav statistika rühmade kaupa, kui andmestikus on diskreetseid väärtusi omav(ad) tunnus(ed)

Näiteks failis stud.gdt on andmed 609 üliõpilase kohta USA Vanderbilti ülikoolist ja diskreetseks tunnuseks on sugu FEM: 1 naine, 0 mees. Kui soovime võrrelda nais- ja meesüliõpilaste matemaatika testi SATM tulemuste kirjeldavat statistikat, kasutame seda valikut. Näeme, et meesüliõpilasi (FEM=0) on valimis 373 ja nende SATM testi aritmeetiline keskmine 6,3255 on veidi suurem kui naisüliõpilastel, keda on 236.