Konsekuensi dari ketidaksetaraan korelasi Gaussian untuk menghitung interval kepercayaan bersama

31

Menurut artikel yang sangat menarik ini di Majalah Quanta: "Bukti yang Sudah Lama Dicari, Ditemukan dan Hampir Hilang" , - telah terbukti bahwa diberi vektor memiliki multivarian Distribusi Gaussian, dan diberi interval berpusat di sekitar sarana komponen yang sesuai dari , laluI 1 , ... , I n xx=(x1,...,xn)saya1,...,sayanx

p(x1I1,,xnIn)i=1np(xiIi)

(Ketimpangan korelasi Gaussian atau GCI; lihat https://arxiv.org/pdf/1512.08776.pdf untuk formulasi yang lebih umum).

Ini tampaknya sangat bagus dan sederhana, dan artikel itu mengatakan ada konsekuensi untuk interval kepercayaan bersama. Namun, tampaknya tidak berguna dalam hal itu bagi saya. Misalkan kita memperkirakan parameter , dan kami menemukan estimator yang normal (mungkin tanpa gejala) secara bersama-sama normal (misalnya, penduga MLE) . Kemudian, jika saya menghitung interval kepercayaan-95% untuk setiap parameter, GCI menjamin bahwa hypercube I_1 \ times \ dots I_n adalah wilayah kepercayaan bersama dengan cakupan tidak kurang dari (0,95) ^ n ... yang cakupannya cukup rendah bahkan untuk sedang n .θ1,...,θnθ1^,...,θn^saya1×...sayan(0,95)nn

Dengan demikian, tampaknya bukan cara yang cerdas untuk menemukan wilayah kepercayaan bersama: wilayah kepercayaan biasa untuk Gaussian multivariat, yaitu, hyperellipsoid, tidak sulit ditemukan jika matriks kovarians diketahui dan lebih tajam. Mungkin bisa berguna untuk menemukan wilayah kepercayaan ketika matriks kovarians tidak diketahui? Bisakah Anda menunjukkan kepada saya contoh relevansi GCI dengan perhitungan wilayah kepercayaan bersama?

DeltaIV
sumber
2
Anda punya ide yang tepat. Interval kepercayaan individu harus jauh lebih tinggi dari 95% untuk wilayah bersama untuk mencapai 95%. Masing-masing harus setidaknya 0,95 dinaikkan ke kekuatan 1 / n.
Michael R. Chernick
1
Koreksi kecil tapi penting: Interval semua harus berpusat di sekitar nol, yaitu . sayaksayak={x:|x|xk}
Alex R.
1
@amoeba Saya tidak khawatir tentang kesulitan pembuktian, tetapi tentang relevansinya dengan statistik yang diterapkan. Jika mempertimbangkan hyperrectangle membuatnya lebih mudah untuk menunjukkan relevansi seperti itu, bagus. Jika sebaliknya Anda berpikir bahwa ketidaksetaraan ini hanya berguna dalam praktik ketika poligon sewenang-wenang dianggap, cukup adil. Saya akan menerima jawaban yang mengatakan "jika Anda hanya mempertimbangkan hyperrectangles, GCI bukan alat yang sangat berguna untuk ahli statistik terapan, karena .... Tetapi jika Anda mempertimbangkan poligon sewenang-wenang, maka itu menjadi relevan, karena ..."
DeltaIV
1
Saya ingin mengedit dan melihat di koran dengan bukti tetapi sekarang saya tidak 100% yakin lagi jika hyperrectangle adalah kasus khusus / mudah atau formulasi yang setara. Saya akan meninggalkannya untuk saat ini dan mungkin kembali ke sini nanti.
Amuba mengatakan Reinstate Monica
1
hyperrectangles berpusat di titik asal (di mana dengan berpusat di titik asal saya maksudkan bahwa masing-masing interval 1D, yang produk Cartesiannya mendefinisikan hyperrectangle, simetris dari asal) jelas merupakan setidaknya kasus khusus (saya tidak tahu apakah mereka merupakan kasus yang setara). Menurut kertas arXiv, ketidaksetaraan ini berlaku untuk semua set cembung simetris. Hiperrectangle adalah himpunan cembung, dan jika dipusatkan pada asal dalam arti yang ditentukan di atas, maka itu simetris, yaitu, . Hx=(x1,...,xn)H-xH
DeltaIV

Jawaban:

2

Saya pikir pertanyaannya lebih relevan. Dalam beberapa hal, Anda melihat beberapa pengujian hipotesis dan membandingkannya dengan menjalankan beberapa pengujian hipotesis.

Ya, memang ada batas bawah yang merupakan produk dari nilai-p dari pengujian dengan asumsi independensi. Ini adalah dasar untuk penyesuaian nilai-p dalam Tes Multi-Hipotesis seperti penyesuaian Bonferroni atau Holm. Tetapi penyesuaian Bonferroni dan Holm (dengan asumsi independensi) adalah tes daya rendah.

Seseorang dapat melakukan jauh lebih baik dalam praktiknya (dan ini dilakukan melalui Bootstrap, lihat misalnya, H White's Bootstrap Reality Check, makalah oleh Romano-Wolf dan set makalah yang lebih baru pada Model-Confidence Sets). Masing-masing adalah upaya pada uji hipotesis daya yang lebih tinggi (misalnya, menggunakan korelasi yang diperkirakan untuk melakukan lebih baik daripada hanya menggunakan batas bawah ini) dan akibatnya jauh lebih relevan.

NBF
sumber