Bagaimana cara menunjukkan bahwa statistik yang memadai TIDAK minimal memadai?

8

Masalah pekerjaan rumah saya adalah memberikan contoh tandingan di mana statistik tertentu secara umum tidak cukup memadai. Terlepas dari rincian menemukan sampel tandingan tertentu untuk statistik khusus ini, ini menimbulkan pertanyaan bagi saya:

Pertanyaan: Bagaimana seseorang dapat merumuskan kondisi tidak menjadi statistik yang cukup minimal dengan cara yang memungkinkan untuk membuktikan bahwa statistik yang cukup memenuhi kondisi tersebut?

Bekerja sejauh ini: Definisi statistik minimum yang memadai di buku teks saya (Keener, Statistik Teoritis: Topik untuk Kursus Inti ) adalah sebagai berikut:

  • Statistik T iff cukup memadai T memadai dan, untuk setiap statistik yang memadai T~ ada fungsi f seperti yang T=f(T~) ae P.

Perhatikan bahwa (ae P) berarti bahwa set di mana kesetaraan gagal adalah set nol untuk setiap distribusi probabilitas P dalam model statistik P, PP.

Mencoba meniadakan ini, saya tiba di:

  • Statistik Tadalah tidak minimal IFF yang cukup setidaknya satu dari berikut ini berlaku:
    1. T Tidak cukup.
    2. Setidaknya ada satu statistik yang cukup T~ yang tidak ada fungsinyaf seperti yang T=f(T~) ae P.

Jadi jika statistik adalah cukup, maka tampaknya seperti itu akan menjadi sangat sulit untuk menunjukkan bahwa tidak minimal cukup, bahkan jika tidak minimal cukup. (Karena seseorang harus menunjukkan 2. bukan 1., karena 1. adalah salah - tetapi 2. akan sangat sulit untuk ditampilkan karena, bahkan jika seseorang memiliki statistik sampel berlawanan)T~dalam pikiran, satu masih harus menunjukkan tidak adanya setiap fungsi dengan properti itu. Dan ketidakberadaan seringkali sulit untuk ditunjukkan.)

Buku teks saya tidak memberikan kondisi yang setara (yaitu diperlukan dan memadai) untuk statistik menjadi statistik yang cukup memadai. Bahkan tidak memberikan alternatif kondisi yang diperlukan untuk statistik menjadi statistik yang cukup minimal (selain menjadi statistik yang cukup).

Oleh karena itu, untuk masalah pekerjaan rumah saya, jika saya tidak dapat menunjukkan bahwa statistiknya tidak mencukupi (karena memang demikian), lalu bagaimana saya bisa menunjukkan bahwa itu tidak cukup memadai?

Chill2Macht
sumber
3
Sudahkah Anda mempertimbangkan mulai dengan statistik yang cukup minimal dan kemudian memperbesarnya untuk memasukkan lebih banyak komponen?
Whuber
3
Dalam matematika secara umum, seseorang sering membuktikan tidak adanya sesuatu dengan menganggapnya ada dan menggunakannya untuk menemukan kontraksi.
Kodiologist
2
Statistik adalah fungsi data yang bernilai vektor. Ini memiliki komponen. Misalnya, statistik minimum yang cukup untuk keluarga distribusi normal adalah dua vektor yang terdiri dari mean sampel dan varians sampel. Menyatukan lebih banyak komponen - misalnya sampel miring dan kurtosis - memberi Anda statistik dengan empat komponen. Petunjuk saya hanya menyatakan yang jelas: statistik baru ini jelas sudah cukup, karena dua komponen pertama sudah cukup. Tetapi apakah itu minimal ?
Whuber
2
Saya tidak melihat bagaimana salah satu pengamatan tentang bijections atau homeomorphisms mungkin relevan. Apakah Anda menggunakan definisi "statistik" atau "cukup" yang tidak biasa?
whuber
3
Anda tampaknya menggunakan semacam definisi kecukupan yang tidak konvensional. Dalam contoh saya, yang penting adalah bahwa statistik baru adalah statistik asli - fungsi data yang dapat diukur. Peta dariR4 untuk R2(yang mengambil dua statistik asli, yang minimal memadai) dapat diukur (memang, dapat dibedakan). Hanya itu yang harus Anda periksa.
Whuber

Jawaban:

1

Seperti yang Anda nyatakan:

Jika ada x1,x2X seperti yang f(x1)=f(x2) tapi g(x1)g(x2), kemudian g tidak dapat ditulis sebagai fungsi dari f, yaitu tidak ada fungsi h dengan g=hf.

Jadi, misalnya, dalam kasus di mana X1,....,Xnadalah variabel acak Bernoulli independen. Kita bisa buktikan itu(x1,....,xn) tidak cukup memadai dengan menunjukkan bahwa itu bukan fungsi dari xi. Ini jelas, karena fungsi harus dipetakan1 untuk keduanya (1,0,0...,0,0,0) dan (0,0,0...,0,0,1).

Euclid
sumber
2

Saya telah memikirkan masalah ini beberapa baru-baru ini, dan inilah yang saya kemukakan.

Membiarkan Ωmenjadi ruang probabilitas, maka variabel acak X adalah fungsi yang dapat diukur X:ΩXdimana X adalah ruang yang terukur (X telah ditunjuk σaljabar, dan X terukur sehubungan dengan ini σ-Aljabar dan σ-Aljabar aktif Ω). The distribusi dariX hanyalah ukuran mundurnya Xyaitu PX(A)=PΩ(X1(A)). Kemudian statistik dariX adalah fungsi * yang dapat diukur f:XYdimana Y adalah ruang terukur sewenang-wenang lainnya.

Diberikan dua statistik f:XY, g:XZ, apa artinya untuk "g menjadi fungsi dari f"?

Sejauh yang saya tahu, tampaknya berarti ada fungsi ** yang dapat diukur h:YZ seperti yang g=hf, yaitu itu gdapat diperhitungkan melalui olehf.

(Dengan kata lain, "g harus didefinisikan dengan baik sebagai fungsi aktif f(X)Y".)

Jadi kapan anjak piutang seperti itu mungkin? Mari kita pikirkan hubungan kesetaraan. Secara khusus, tentukan hubungan ekivalensif di X oleh x1fx2f(x1)=f(x2), juga, mendefinisikan hubungan ekivalensi g di X oleh x1gx2g(x1)=g(x2).

Kemudian agar g menjadi faktor oleh f, hubungan kesetaraan f dan g harus kompatibel satu sama lain, dalam arti *** itu untuk apa pun x1,x2X, x1fx2x1gx2yaitu g tidak dapat mengambil dua elemen yang setara di bawah f dan memetakannya ke nilai yang tidak setara di bawah gyaitug tidak dapat membatalkan pengurangan informasi yang sebelumnya dilakukan oleh f".

Dengan kata lain, g harus didefinisikan dengan baik sebagai fungsi aktif X/ff(X), Yaitu ada harus ada fungsi g~:X/fZ seperti yang g=g~πfdimana πf adalah proyeksi kanonik XX/f. (Bagi mereka yang tidak nyaman dengan abstrak yang tidak masuk akal,πf pada dasarnya f, dan g~ pada dasarnya h. Formulasi di atas hanya membuat analogi dengan situasi lain lebih jelas.)

Dengan kata-kata sesederhana mungkin, g dapat ditulis sebagai fungsi dari f jika dan hanya jika, untuk apa pun x1,x2X, f(x1)=f(x2)g(x1)=g(x2).

Sebagai contoh, ambil X=Y=Z=R dan X variabel acak bernilai nyata yang sewenang-wenang, kemudian g:xx2 dapat ditulis sebagai fungsi dari f:xx, tetapi tidak sebaliknya, karena x1=x2x12=x22tapi 12=(1)2 tapi 11.

Secara khusus, asumsikan bahwa setiap kelas kesetaraan di bawah f adalah singleton (mis fbersifat injeksi ). Kemudiang selalu dapat ditulis sebagai fungsi dari f, sejak X/fXyaitu f(x1)=f(x2)x1=x2 maksudnya x1=x2f(x1)=f(x2) (secara umum, untuk belum tentu suntik f, hanya satu arah berlaku), jadi kondisi kita menjadi x1=x2g(x1)=g(x2), Yang sepele puas untuk apa pun g:XZ. (Untuk mendefinisikanh, ia dapat melakukan apapun yang diinginkannya Yf(X) selama itu bisa diukur, dan kemudian untuk apa pun yf(X), yaitu sedemikian rupa sehingga y=f(x) untuk beberapa xX, tentukan h menjadi h:y=f(x)g(x). Ini didefinisikan dengan baik kapanfbersifat suntik karena ada yang unik xX seperti yang f(x)=y. Lebih umum, ini hanya ditentukan kapan, terlepas dari manax kami memilih masuk f1(y), g(x) masih memiliki nilai yang sama, yaitu f(x1)=f(x2) (=y)g(x1)=g(x2).)

Juga, melihat Teorema 3.11 dalam Keener, pernyataannya agak kikuk, tetapi berpikir dalam istilah di atas, saya percaya itu dapat ditulis ulang sebagai:

Seharusnya Tadalah statistik yang memadai ****. Maka kondisi yang cukup untukT menjadi cukup minimal adalah bahwa ia dapat ditulis sebagai fungsi dari rasio kemungkinan.

Dari sini menjadi jelas bahwa rasio kemungkinan itu sendiri harus minimal.

Ini juga mengarah pada kesimpulan bahwa:

Jika ada x1,x2X seperti yang f(x1)=f(x2) tapi g(x1)g(x2), kemudian gbisa tidak ditulis sebagai fungsif, Yaitu terdapat ada fungsih dengan g=hf.

Jadi kondisinya sebenarnya tidak sesulit yang saya tunjukkan.


* Keener tidak membahas masalah apakah suatu statistik perlu diukur atau hanya fungsi yang sewenang-wenang atau tidak. Namun, saya cukup yakin bahwa statistik harus menjadi fungsi yang terukur, karena kalau tidak kita tidak bisa mendefinisikan distribusi untuk itu , yaitu ukuran mundur.

**Jika h tidak terukur, kami akan memiliki kontradiksi karena keduanya f dan gdapat diukur dan komposisi fungsi yang terukur dapat diukur kembali. Setidaknya,h harus dapat diukur terbatas pada f(X)Y, meskipun saya pikir ini akan berarti dalam kebanyakan kasus itu masuk akal h harus menyetujui f(X) dengan fungsi yang dapat diukur pada semua Y (mengambil h|f(X) di f(X) dan misalnya z di Yf(X) jika ada titik terukur zZ, perhatikan bahwa keduanya f(X) dan Yf(X) harus dapat diukur dalam Y) jadi wlog h dapat diasumsikan terukur pada semua Y.

*** Setidaknya ini perlu dan cukup untuk keberadaan fungsi sewenang-wenang melalui faktor g dan berakhir f, dan saya pikir ** menyiratkan bahwa jika fungsi sewenang-wenang itu ada, fungsi ini juga harus dapat diukur, karena keduanya f dan g adalah, yaitu benar-benar akan menjadi statistik YZ.

**** Kondisi yang diberikan setara dengan T cukup oleh teorema faktorisasi, 3.6.

Chill2Macht
sumber
1
Bagaimana Anda mendefinisikan rasio kemungkinan?
Xi'an
@ Xi'an Saya tidak begitu ingat semua hal bodoh yang saya tulis di atas, jadi jujur ​​saja, saya tidak yakin bagian mana yang Anda maksud. Jika Anda secara implisit menyarankan bahwa saya pertama kali membuktikan bahwa statistik rasio kemungkinan cukup minimal, dan kemudian mengurangi bukti kecukupan minimum lainnya untuk "kesetaraan kecukupan" yang sesuai dengan statistik rasio kemungkinan, yang mungkin sangat membantu dalam praktik, tetapi setidaknya secara teoritis hanya tampaknya menendang kaleng di jalan (karena kalau begitu bagaimana orang memahami bukti kecukupan statistik LR minimal)
Chill2Macht