Mengapa tepatnya informasi Fisher yang diamati digunakan?

17

Dalam pengaturan kemungkinan maksimum standar (sampel I Y1,,Yn dari beberapa distribusi dengan kepadatan fy(y|θ0 )) dan dalam kasus model yang ditentukan dengan benar, informasi Fisher diberikan oleh

I(θ)=Eθ0[2θ2lnfy(θ)]

di mana harapan diambil sehubungan dengan kepadatan sebenarnya yang menghasilkan data. Saya telah membaca informasi Fisher yang diamati

J^(θ)=2θ2lnfy(θ)

digunakan utama karena integral yang terlibat dalam menghitung (diharapkan) Informasi Fisher mungkin tidak layak dalam beberapa kasus. Yang membingungkan saya adalah bahwa bahkan jika integral dapat dilakukan, harapan harus diambil sehubungan dengan model yang benar, yang melibatkan nilai parameter yang tidak diketahui . Jika itu terjadi tampak bahwa tanpa mengetahui tidak mungkin untuk menghitung . Apakah ini benar?θ0θ0I

pengguna2249626
sumber

Jawaban:

13

Anda punya empat quanties sini: parameter yang benar , perkiraan konsisten θ , informasi diharapkan I ( θ ) di θ dan informasi diamati J ( θ ) di θ . Kuantitas ini hanya ekuivalen asimptotik, tetapi itu biasanya bagaimana mereka digunakan.θ0θ^I(θ)θJ(θ)θ

  1. Informasi yang diamati konvergen dalam probabilitas dengan informasi yang diharapkan I(θ0)=Eθ0[2

    J(θ0)=1Ni=1N2θ02lnf(yi|θ0)
    ketikaYadalah sampel pertama dari f(θ0). Di siniEθ0(x)menunjukkan harapan w / r / t distribusi diindeks olehθ0:xf(x|θ0)dx. Konvergensi ini berlaku karena hukum bilangan besar, sehingga asumsi bahwaYf(
    I(θ0)=Eθ0[2θ02lnf(y|θ0)]
    Yf(θ0)Eθ0(x)θ0xf(x|θ0)dx sangat penting di sini.Yf(θ0)
  2. θ^θ0θ0

Ucapan

Ketika Anda menduga, informasi yang diamati biasanya lebih mudah untuk dikerjakan karena diferensiasi lebih mudah daripada integrasi, dan Anda mungkin telah mengevaluasinya dalam beberapa optimasi numerik. Dalam beberapa keadaan (distribusi Normal) mereka akan sama.

Artikel "Menilai Akurasi Pengukur Kemungkinan Maksimum: Informasi Nelayan Teramati vs. Diharapkan" oleh Efron dan Hinkley (1978) membuat argumen yang mendukung informasi yang diamati untuk sampel terbatas.

Andrew M
sumber
4

Ada beberapa studi simulasi yang tampak mendukung pengamatan teori Efron & Hinkley (yang disebutkan dalam jawaban Andrew), inilah yang saya tahu tentang begitu saja: Maldonado, G. dan Greenland, S. (1994). Perbandingan kinerja interval kepercayaan berbasis model ketika bentuk model yang benar tidak diketahui. Epidemiologi, 5, 171-182. Saya belum melihat studi yang bertentangan. Sangat menarik kemudian bahwa paket GLM standar saya tahu menggunakan informasi yang diharapkan untuk menghitung interval Wald. Tentu saja ini bukan masalah ketika (seperti dalam GLM linear dalam parameter alami) matriks informasi yang diamati dan diharapkan sama.

Sander Greenland
sumber