pptx

by user

on
Category: Documents
59

views

Report

Comments

Description

Transcript

pptx
Antonella Bodini
Istituto di Matematica Applicata e Tecnologie Informatiche
β€œE. Magenes” del CNR
Materiale ad uso dei ricercatori che hanno seguito il corso di
formazione interna in Statistica, edizione 2016.
STATISTICA
Inferenza
Stima puntuale
e se il parametro di interesse
non è nè la media nè la varianza?
Stima puntuale
Abbiamo stimato i momenti teorici con i momenti campionari.
Metodo dei momenti: riconduciamo i parametri incogniti ai
momenti, e stimiamo coi momenti campionari
Esempio
𝐸 𝑋
π‘‰π‘Žπ‘Ÿ 𝑋
π‘‰π‘Žπ‘Ÿ 𝑋 = 𝛼𝛽 2 = 𝐸(𝑋) 𝛽
𝑋 = 𝛼𝛽
e
𝑆 2 = 𝛼𝛽 2
π‘₯ = 166.3 π‘π‘š e 𝑠 2 = 225.87 π‘π‘š2
𝛼𝛽 = 166.3
(𝛼𝛽)𝛽 = 225.87
166.3
= 122.46
1.358
225.87
𝛽=
= 1.358
166.3
𝛼=
Questi stimatori si comportano bene ?
Stima puntuale: MM
π‘“πœƒ (π‘₯)
𝑋~π‘ˆπ‘›π‘–π‘“ 0, πœƒ β‡’ 𝐸 𝑋 = πœƒ2 β‡’ πœƒ = 2𝑋𝑛
1/πœƒ
> 2*mean(x)
[1] 1.812466
> max(x)
[1] 1.990049
πœƒ
π‘₯
= 1.812466
>x
[1] 0.04588809 1.84642833 1.04290239 0.48192084 0.68065773 0.85211674
[7] 0.19199022 0.32921000 0.59413324 0.03819111 0.31429584 1.54480627
[13] 0.81648323 0.28769664 1.04676548 1.65876192 0.46033458 1.74407519
[19] 1.22742032 1.10831683 0.60514033 0.46439537 1.35755028 1.45826717
[25] 0.62528918 0.31187911 0.31748200 1.10792811 1.05928701 1.51511994
[31] 0.65703749 1.09660804 0.31160304 1.65906356 0.03914091 1.44712477
[37] 1.36627015 1.94410176 0.58453516 1.16628969 0.11202316 1.04723572
[43] 0.27090882 1.99004919 0.14975644 0.99492563 1.42170399 0.53840454
[49] 1.86698647 1.51315170
> sort(x)
[1] 0.03819111 0.03914091 0.04588809 0.11202316 0.14975644 0.19199022
[7] 0.27090882 0.28769664 0.31160304 0.31187911 0.31429584 0.31748200
[13] 0.32921000 0.46033458 0.46439537 0.48192084 0.53840454 0.58453516
[19] 0.59413324 0.60514033 0.62528918 0.65703749 0.68065773 0.81648323
[25] 0.85211674 0.99492563 1.04290239 1.04676548 1.04723572 1.05928701
[31] 1.09660804 1.10792811 1.10831683 1.16628969 1.22742032 1.35755028
[37] 1.36627015 1.42170399 1.44712477 1.45826717 1.51315170 1.51511994
[43] 1.54480627 1.65876192 1.65906356 1.74407519 1.84642833 1.86698647
[49] 1.94410176 1.99004919
Stima puntuale
Finora abbiamo ragionato considerando il modello che rende più plausibili i
dati che abbiamo.
> sort(x)
[1] 0.03819111 0.03914091 0.04588809 0.11202316 0.14975644 0.19199022
[7] 0.27090882 0.28769664 0.31160304 0.31187911 0.31429584 0.31748200
[13] 0.32921000 0.46033458 0.46439537 0.48192084 0.53840454 0.58453516
[19] 0.59413324 0.60514033 0.62528918 0.65703749 0.68065773 0.81648323
[25] 0.85211674 0.99492563 1.04290239 1.04676548 1.04723572 1.05928701
[31] 1.09660804 1.10792811 1.10831683 1.16628969 1.22742032 1.35755028
[37] 1.36627015 1.42170399 1.44712477 1.45826717 1.51315170 1.51511994
[43] 1.54480627 1.65876192 1.65906356 1.74407519 1.84642833 1.86698647
[49] 1.94410176 1.99004919
1.99…
2!
2.5!
𝑋~π‘ˆπ‘›π‘–π‘“ 0, πœƒ
Che stima dareste,
che renda plausibili
tutti i dati?
2.3527!
3!
π‘“πœƒ (π‘₯)
1/πœƒ
2.1!
2.71!
πœƒ
π‘₯
Stima puntuale
"π‘ƒπœƒ=1.99004919 𝑑𝑒𝑑𝑑𝑖 𝑖 π‘‘π‘Žπ‘‘π‘– π‘ π‘‘π‘–π‘Žπ‘›π‘œ π‘‘π‘Ÿπ‘Ž 0 𝑒 1.99004919 = 1"
"π‘ƒπœƒ=2.3527 𝑑𝑒𝑑𝑑𝑖 𝑖 π‘‘π‘Žπ‘‘π‘– π‘ π‘‘π‘–π‘Žπ‘›π‘œ π‘‘π‘Ÿπ‘Ž 0 𝑒 1.99004919 =
1.99004919
= 0.85"
2.3527
> sort(x)
[1] 0.03819111 0.03914091 0.04588809 0.11202316 0.14975644 0.19199022
[7] 0.27090882 0.28769664 0.31160304 0.31187911 0.31429584 0.31748200
[13] 0.32921000 0.46033458 0.46439537 0.48192084 0.53840454 0.58453516
[19] 0.59413324 0.60514033 0.62528918 0.65703749 0.68065773 0.81648323
[25] 0.85211674 0.99492563 1.04290239 1.04676548 1.04723572 1.05928701
[31] 1.09660804 1.10792811 1.10831683 1.16628969 1.22742032 1.35755028
[37] 1.36627015 1.42170399 1.44712477 1.45826717 1.51315170 1.51511994
[43] 1.54480627 1.65876192 1.65906356 1.74407519 1.84642833 1.86698647
[49] 1.94410176 1.99004919
1.99…
2!
2.5!
𝑋~π‘ˆπ‘›π‘–π‘“ 0, πœƒ
Tutti questi valori
vanno bene: quale
scegliere?
2.3527!
3!
π‘“πœƒ (π‘₯)
1/πœƒ
2.1!
2.71!
πœƒ
π‘₯
Stima puntuale
Scegliamo come stimatore qualcosa che dia ai dati
osservati la massima probabilità di realizzarsi.
Stima puntuale
Esempio nel discreto. Campione di 100 intervistati di cui il 42%
dichiara di votare per il CD. π‘₯1 , … , π‘₯100 = 1,0,0,1,0,1, … , 1 ove 1=CD,
0 no CD. Ci saranno 42 dati pari a 1 e i rimanenti pari a 0.
Modello bernoulliano: π‘π‘’π‘Ÿπ‘›(πœƒ)
è funzione di πœƒ
π‘ƒπœƒ 𝑋1 , … , 𝑋100 = 1,0,0,1,0,1, … , 1
= π‘ƒπœƒ (𝑋1 = 1)π‘ƒπœƒ (𝑋2 = 0)π‘ƒπœƒ (𝑋3 = 0) β‹― π‘ƒπœƒ (𝑋100 = 1)
= πœƒ 42 (1 βˆ’ πœƒ)100βˆ’42 = πœƒ 𝑛π‘₯ (1 βˆ’ πœƒ)π‘›βˆ’π‘›π‘₯
πœƒ = 𝑋𝑛
massimizzare la
probabilità
πœƒ
1βˆ’ πœƒ
πœƒ che massimizza
𝐿 πœƒ; π‘₯1 , … , π‘₯𝑛 =
π‘ƒπœƒ (𝑋 = π‘₯𝑖 )
𝑖=1,…,𝑛
funzione di verosimiglianza
Stima puntuale
Esempio in originale. Campione di 1750 intervistati di cui il 42%
dichiara di votare per il CD. π‘₯1 , … , π‘₯100 = 1,0,0,1,0,1, … , 1 ove 1=CD,
0 no CD. Ci saranno 735 dati pari a 1 e i rimanenti pari a 0.
Modello bernoulliano: π‘π‘’π‘Ÿπ‘›(πœƒ)
π‘ƒπœƒ 𝑋1 , … , 𝑋1750 = 1,0,0,1,0,1, … , 1
πœƒ che massimizza
= πœƒ 735 (1 βˆ’ πœƒ)1750βˆ’735
π‘™π‘œπ‘”[𝐿 πœƒ; π‘₯1 , … , π‘₯𝑛 ] =
π‘™π‘œπ‘” π‘ƒπœƒ 𝑋 = π‘₯𝑖
funzione di log-verosimiglianza
𝑖=1,…,𝑛
Esempio
𝑋~π‘ˆπ‘›π‘–π‘“ 0, πœƒ :
π‘ƒπœƒ 𝑋1 , … , 𝑋50 = π‘₯1 , … , π‘₯50
𝐿 πœƒ; π‘₯1 , … , π‘₯𝑛 =
= π‘ƒπœƒ (𝑋1 = π‘₯1 ) β‹― π‘ƒπœƒ (𝑋50 = π‘₯50 ) = 0 !
π‘ƒπœƒ 𝑋 = π‘₯𝑖 = 0 !
π‘“πœƒ (π‘₯𝑖 )
𝑖=1,…,𝑛
π‘“πœƒ π‘₯ =
1
πœƒ
𝐼
0,πœƒ
(π‘₯), 𝐼
0,πœƒ
π‘₯ =
1, se π‘₯ < πœƒ
0, se π‘₯ β‰₯ πœƒ
> sort(x)
[1] 0.03819111 0.03914091 0.04588809 0.11202316 0.14975644 0.19199022
[7] 0.27090882 0.28769664 0.31160304 0.31187911 0.31429584 0.31748200
[13] 0.32921000 0.46033458 0.46439537 0.48192084 0.53840454 0.58453516
[19] 0.59413324 0.60514033 0.62528918 0.65703749 0.68065773 0.81648323
[25] 0.85211674 0.99492563 1.04290239 1.04676548 1.04723572 1.05928701
[31] 1.09660804 1.10792811 1.10831683 1.16628969 1.22742032 1.35755028
[37] 1.36627015 1.42170399 1.44712477 1.45826717 1.51315170 1.51511994
[43] 1.54480627 1.65876192 1.65906356 1.74407519 1.84642833 1.86698647
[49] 1.94410176 1.99004919
> x<-runif(50,0,2)
fate un po’ di prove con 𝑛 = 20
𝐿 πœƒ; π‘₯1 , … , π‘₯𝑛 =
1
πœƒπ‘›
𝐼(0,πœƒ) π‘₯𝑖 =
𝑖=1,…,𝑛
𝐼(0,πœƒ) π‘₯𝑖
𝑖=1,…,𝑛
1, se π‘šπ‘Žπ‘₯ π‘₯𝑖 < πœƒ
0, se π‘šπ‘Žπ‘₯ π‘₯𝑖 β‰₯ πœƒ
πœƒπ‘€πΏπΈ = max 𝑋𝑖
Esempio per la gaussiana
𝑋𝑖 ~𝑁(πœ‡, 𝜎 2 )
campione casuale gaussiano con entrambi i
parametri incogniti: πœƒ = (πœ‡, 𝜎 2 )
1
𝐿 πœ‡, 𝜎 2 ; π‘₯1 , … , π‘₯𝑛 =
𝑖=1,…,𝑛
2πœ‹πœŽ 2
( π‘₯ βˆ’πœ‡)2
βˆ’ 𝑖 2
𝑒 2𝜎
1
βˆ’
=
𝑒
(2πœ‹πœŽ 2 )𝑛/2
𝑖=1,…,𝑛(π‘₯𝑖
2𝜎2
βˆ’πœ‡)2
𝜎2
𝜎2
πœ‡
πœ‡
Stimatore MV
β€’ Possono esserci diversi massimi locali
β€’ Può essere distorto (biased)
β€’ Può non esistere
β€’ Se esiste ed è unico, è una funzione della statistica sufficiente
densità della famiglia esponenziale a k parametri:
π‘“πœƒ π‘₯1 , … , π‘₯𝑛 = exp
𝑄𝑖 πœƒ π‘»π’Š 𝒙 + 𝑆 π‘₯ + 𝐷(πœƒ)
𝑖=1,…,π‘˜
β€’ Sotto opportune condizioni di regolarità per π‘“πœƒ , ha importanti
proprietà asintotiche, tra cui la normalità:
πœƒπ‘› βˆ’ πœƒ
𝜎2 𝑛
𝑑
𝑍~𝑁(0,1)
con
𝜎 2 = πΈπœƒ
πœ• logπ‘“πœƒ (π‘₯)
πœ•πœƒ
2 βˆ’1
informazione
di Fisher
Fly UP