Hasil asimptotik tidak dapat dibuktikan dengan simulasi komputer, karena mereka adalah pernyataan yang melibatkan konsep infinity. Tetapi kita harus bisa mendapatkan perasaan bahwa segala sesuatunya benar-benar berbaris seperti yang dikatakan teori.
Pertimbangkan hasil teoretis
di mana adalah fungsi dari variabel acak, katakanlah terdistribusi secara identik dan independen. Ini mengatakan bahwa konvergen dalam probabilitas ke nol. Contoh pola dasar di sini saya kira adalah kasus di mana adalah mean sampel dikurangi nilai yang diharapkan umum dari iidrv tentang sampel,
PERTANYAAN: Bagaimana kita dapat dengan meyakinkan menunjukkan kepada seseorang bahwa hubungan di atas "terwujud di dunia nyata", dengan menggunakan hasil simulasi komputer dari sampel yang terbatas?
Harap dicatat bahwa saya secara khusus memilih konvergensi ke konstanta .
Saya berikan di bawah pendekatan saya sebagai jawaban, dan saya berharap yang lebih baik.
UPDATE: Sesuatu di belakang kepala saya mengganggu saya - dan saya menemukan apa. Saya menggali pertanyaan yang lebih tua di mana diskusi yang paling menarik berlangsung di komentar ke salah satu jawaban . Di sana, @ Cardinal memberikan contoh estimator yang konsisten tetapi variansinya tetap nol dan terbatas asimtotik. Jadi varian yang lebih sulit dari pertanyaan saya menjadi: bagaimana kita menunjukkan dengan simulasi bahwa suatu statistik konvergen dalam probabilitas menjadi konstan, ketika statistik ini mempertahankan varian non-nol dan terbatas asimtotik?
sumber
Jawaban:
Saya menganggap sebagai fungsi distribusi (yang saling melengkapi dalam kasus tertentu). Karena saya ingin menggunakan simulasi komputer untuk menunjukkan bahwa segala sesuatu cenderung seperti yang dikatakan hasil teoretis, saya perlu membangun fungsi distribusi empiris, atau distribusi frekuensi relatif empiris, dan kemudian entah bagaimana menunjukkan bahwa ketika meningkat, nilai berkonsentrasi "semakin banyak" ke nol. | X n | n | X n |P() |Xn| n |Xn|
Untuk mendapatkan fungsi frekuensi relatif empiris, saya perlu (banyak) lebih dari satu sampel yang bertambah besar, karena ketika ukuran sampel meningkat, distribusiperubahan untuk setiap perbedaan . n|Xn| n
Jadi saya perlu menghasilkan dari distribusi 's, sampel "secara paralel", katakanlah mulai dalam ribuan, masing-masing dari beberapa ukuran awal , katakanlah berkisar dalam puluhan ribu. Maka saya perlu menghitung nilaidari masing-masing sampel (dan untuk sama ), yaitu memperoleh serangkaian nilai . m m n n | X n | n { | x 1 n | , | x 2 n | , . . . , | x m n | }Yi m m n n |Xn| n {|x1n|,|x2n|,...,|xmn|}
Nilai-nilai ini dapat digunakan untuk membangun distribusi frekuensi relatif empiris. Memiliki kepercayaan pada hasil teoritis, saya berharap bahwa "banyak" dari nilaiakan "sangat dekat" dengan nol - tetapi tentu saja, tidak semua.|Xn|
Jadi untuk menunjukkan bahwa nilai-nilaimemang berbaris menuju nol dalam jumlah yang lebih besar dan lebih besar, saya harus mengulangi proses, meningkatkan ukuran sampel untuk mengatakan , dan menunjukkan bahwa sekarang konsentrasi ke nol "telah meningkat". Jelas untuk menunjukkan bahwa itu telah meningkat, kita harus menentukan nilai empiris untuk .2 n ϵ|Xn| 2n ϵ
Apakah itu cukup? Bisakah kita memformalkan "peningkatan konsentrasi" ini? Bisakah prosedur ini, jika dilakukan dalam lebih banyak langkah "peningkatan ukuran sampel", dan yang lebih dekat dengan yang lain, memberi kami beberapa perkiraan tentang tingkat konvergensi yang sebenarnya , yaitu sesuatu seperti "massa probabilitas empiris yang bergerak di bawah ambang batas per masing-masing -Langkah", katakanlah, seribu?n
Atau, periksa nilai ambang batas yang, katakanlah % dari probabilitas terletak di bawah, dan lihat bagaimana nilai berkurang besarnya?ϵ90 ϵ
SEBUAH CONTOH
Anggap sebagai dan seterusnya U ( 0 , 1 )Yi U(0,1)
Kami pertama kali menghasilkan sampel ukuran masing-masing. Distribusi frekuensi relatif empirissepertim=1,000 n=10,000 |X10,000|
dan kami mencatat bahwa % dari nilailebih kecil dari .90.10 |X10,000| 0.0046155
Selanjutnya saya menambah ukuran sampel menjadi . Sekarang distribusi frekuensi relatif empiristerlihat seperti dan kami perhatikan bahwa % dari nilaidi bawah . Atau, sekarang % dari nilai jatuh di bawah .n=20,000 |X20,000| 91.80 |X20,000| 0.0037101 98.00 0.0045217
Apakah Anda akan dibujuk oleh demonstrasi seperti itu?
sumber