Vabalt kasutatav ökonomeetriapakett Gretl

Programmi kodulehekülg https://gretl.sourceforge.net

Binaarne logit mudel

Binaarset mudelit kasutatakse siis, kui sõltuv tunnus Y saab omada vaid kahte väärtust: 0 või 1. Binaarse logit mudeli korral otsitakse binaarse muutuja \(Y\) väärtuse 1 esinemise tõenäosust kujul $$P(Y = 1|\mathbf{X}) = \frac{1}{1 + e^{ -\Lambda }},$$ kus logit \(\Lambda\) on lineaarne funktsioon regressoritest \(x_j\): $$\Lambda = {\theta _0} + {\theta _1}{x_1} + {\theta _2}{x_2} + \cdots + {\theta _k}{x_k}.$$ Parameetrite \(\theta_j\) hindamiseks kasutatakse suurima tõepära meetodit MLE (Maximum Likelihood Estimation).

Põhimenüüst
Model -> Limited dependent variable -> Logit -> Binary

Seejärel tuleb aknas "gretl: specify model" olemasolevate tunnuste komplektist valida sõltuv tunnus (Dependent variable) ja üks või mitu regressorit (Regressors).

Lisavalikud
NÄIDE

Kasutame andmefaili Gujarati Table_15.7.gdt, kus on ühe ülikooli üliõpilaste õppeedukuse andmed. GRADE=1, kui üliõpilase tulemus aines mikroökonoomika oli A ja GRADE=0, kui tulemus oli B või C. Sõltuvaks tunnuseks on GRADE, regressoriteks GPA, TUCE ja PSI. Põhimenüüst Model -> Limited dependent variable -> Logit -> Binary.

Valime sellise aruande, kus kuvatakse olulisuse tõenäosused p.



Genereeritakse vastav aruanne

Parameetri standardviga Parameetri hinnang Sõltuva tunnuse keskmine Logaritmiline tõepära Schwarziinformatsiooni-kriteerium Hannan-Quinniinformatsiooni-kriteerium Sõltuva tunnuse standardhälve KorrigeeritudMcFaddeni R2 McFaddeni R2 Akaike informatsiooni-kriteerium z-statistik z-testi olulisusetõenäosus Õigete prognoosi-de arv ja osakaal Tõepära suhte test mudeli olulisusetestimiseks Tõenäosuse marginaal-väärtus logiti suhtes Tegelike ja prognoositud väärtuste kokkulangevus

Sõltuva tunnuse GRADE keskmine 0,344 näitab, et 34,4%-l valimisse kuulunud üliõpilastest GRADE=1.

Tõepära suhte testi olulisuse tõenäosus \(p=0,0015 < 0,05 \) ning nullhüpotees on ümber lükatud: mudel on statistiliselt oluline.

Tunnuse TUCE olulisuse tõenäosus \(p=0,5014 > 0,05 \) ja see tunnus ei ole statistiliselt oluline, teised tunnused on.

Õigesti prognoositud vaatluste arv on 26, mis teeb 81,3% kõikidest vaatlustest. Nendest nulle on õigesti prognoositud 18 vaatluse korral, mis on 85,7% kõikidest nullidest. Ühtesid on õigesti prognoositud 8 korral, mis on 72,7% kõikidest ühtedest. Seega nullide prognoosimisvõime on mõnevõrra kõrgem.

Regressorite mõju suunda tõenäosusele \(P(GRADE=1)\) näitavad parameetrite märgid:

Regressorite mõju täpsemaks uurimiseks tuleks vaadata tõenäosuse marginaalväärtusi. Selleks hindame mudelit uuesti ja aknas "gretl: specify model" teeme valiku Show slopes at mean. Kuvatakse samasugune aruanne, kuid tabeli viimases veerus slope on tõenäosuse marginaalväärtused sellise vaatluse jaoks, millel seletavate tunnuste väärtused võrduvad valimi keskmistega.

Tõenäosuse marginaalväärtuste arvutamisel kasutatakse tõenäosuse marginaalväärtust logiti suhtes. Näiteks tõenäosuse marginaalväärtus tunnuse GPA suhtes

$$\frac{\partial P}{\partial \, \text{GPA}}=\frac{dP} {d \Lambda} \theta_j = 0{,}189\cdot 2{,}82611 \approx 0,534.$$ Järelikult, kui üliõpilase sisseastumise testi keskmine tulemus GPA oli 1 punkti võrra kõrgem, siis tõenäosus, et ta mikroökonoomika eksamil sai tulemuseks "A" (GRADE=1), on 0,534 võrra suurem. See kehtib nö keskmise üliõpilase jaoks, kellel GPA, TUCE ja PSI omavad keskmisi väärtusi.