Kami biasanya diperkenalkan dengan metode penduga momen dengan "menyamakan momen populasi dengan sampel pendampingnya" hingga kami memperkirakan semua parameter populasi; sehingga, dalam kasus distribusi normal, kita hanya perlu momen pertama dan kedua karena mereka sepenuhnya menggambarkan distribusi ini.
Dan kami secara teoritis dapat menghitung hingga momen tambahan sebagai:
Bagaimana saya bisa membangun intuisi untuk momen apa sebenarnya? Saya tahu mereka ada sebagai konsep dalam fisika dan matematika, tetapi saya menemukan keduanya tidak dapat diterapkan secara langsung, terutama karena saya tidak tahu bagaimana membuat abstraksi dari konsep massa ke titik data. Istilah ini tampaknya digunakan secara khusus dalam statistik, yang berbeda dari penggunaan dalam disiplin ilmu lain.
Apa karakteristik data saya yang menentukan berapa banyak ( ) momen yang ada secara keseluruhan?
Jawaban:
Sudah lama sejak saya mengambil kelas fisika, jadi beri tahu saya jika semua ini salah.
Gambaran umum momen dengan analog fisik
Mengambil variabel acak, . The saat -th sekitar adalah: berkorespondensi ini persis dengan arti fisik sesaat. Bayangkan sebagai kumpulan poin di sepanjang garis nyata dengan kepadatan yang diberikan oleh pdf. Tempatkan titik tumpu di bawah garis ini di dan mulai menghitung momen relatif terhadap titik tumpu itu, dan perhitungan akan sesuai persis dengan momen statistik.n X c m n ( c ) = E [ ( X - c ) n ] X cX n X c
Sebagian besar waktu, saat -th mengacu pada saat sekitar 0 (saat-saat di mana titik tumpu ditempatkan pada 0): The -th sentral saat adalah: Ini sesuai dengan momen di mana titik tumpu ditempatkan di pusat massa, sehingga distribusinya seimbang. Ini memungkinkan momen untuk lebih mudah ditafsirkan, seperti yang akan kita lihat di bawah ini. Momen sentral pertama akan selalu nol, karena distribusinya seimbang.X m n = E [ X n ] n X m n = m n ( m 1 ) = E [ ( X - m 1 ) n ]n X
The -th standar saat adalah: Sekali lagi, ini menskala momen dengan penyebaran distribusi, memungkinkan interpretasi yang lebih mudah khususnya Kurtosis. Momen standar pertama akan selalu nol, momen kedua akan selalu menjadi nol. Ini sesuai dengan momen skor standar (skor-z) suatu variabel. Saya tidak memiliki analog fisik yang bagus untuk konsep ini.X ~ m n = m nn X
Momen yang umum digunakan
Untuk distribusi apa pun, ada potensi momen tak terbatas. Saat-saat yang cukup hampir selalu akan sepenuhnya menjadi ciri dan distribusi (menurunkan kondisi yang diperlukan untuk memastikan hal ini adalah bagian dari masalah saat ). Empat momen biasanya banyak dibicarakan dalam statistik:
Kami jarang berbicara tentang saat-saat di luar Kurtosis, justru karena hanya ada sedikit intuisi bagi mereka. Ini mirip dengan fisikawan yang berhenti setelah momen kedua.
sumber
Ini sedikit dari utas lama, tetapi saya ingin memperbaiki salah saji dalam komentar oleh Fg Nu yang menulis "Momen diparameterisasi dengan bilangan asli, dan sepenuhnya mencirikan distribusi".
Momen TIDAK sepenuhnya mencirikan distribusi. Secara khusus, pengetahuan tentang semua momen yang tak terbatas, bahkan jika ada, tidak secara unik menentukan distribusi.
Per buku probabilitas favorit saya, Feller "Pengantar Teori Probabilitas dan Penerapannya Vol II" (lihat jawaban saya di contoh kehidupan nyata dari distribusi umum ), bagian VII.3 contoh di hlm. 227-228, Lognormal tidak ditentukan berdasarkan momennya, artinya ada distribusi lain yang memiliki semua momen tak terbatas sama dengan Lognormal, tetapi fungsi distribusi berbeda. Seperti diketahui secara luas, Moment Generating Function tidak ada untuk Lognormal, juga tidak bisa untuk distribusi lain ini yang memiliki momen yang sama.
Sebagaimana dinyatakan pada hal. 228, variabel pada dasarnya bukan nol ditentukan oleh momen-momennya jika semuanya ada danX
menyimpang. Perhatikan bahwa ini bukan jika dan hanya jika. Kondisi ini tidak berlaku untuk Lognormal, dan memang itu tidak ditentukan oleh momennya.
Di sisi lain, distribusi (variabel acak) yang berbagi semua jumlah momen tak terbatas, hanya dapat sangat berbeda, karena ketidaksetaraan yang dapat diturunkan dari momennya.
sumber
Sebuah konsekuensi wajar dari pernyataan Glen_b adalah bahwa momen pertama, rata-rata, sesuai dengan pusat gravitasi untuk objek fisik, dan momen kedua di sekitar rata-rata, varians, sesuai dengan momen inersia. Setelah itu, Anda sendirian.
sumber
Pohon binomial memiliki dua cabang masing-masing dengan kemungkinan 0,5. Sebenarnya, p = 0,5, dan q = 1-0,5 = 0,5. Ini menghasilkan distribusi normal dengan massa probabilitas terdistribusi secara merata.
Sebenarnya, kita harus mengasumsikan bahwa setiap tingkatan dalam pohon sudah lengkap. Ketika kami memecah data menjadi sampah, kami mendapatkan nomor nyata dari divisi, tetapi kami mengumpulkan. Ya, itu tingkat yang tidak lengkap, jadi kami tidak berakhir dengan histogram yang mendekati normal.
Ubah probabilitas percabangan ke p = 0,9999 dan q = 0,0001 dan itu membuat kita menjadi condong normal. Massa probabilitas bergeser. Itu menyumbang kemiringan.
Memiliki tingkatan atau tempat sampah yang kurang dari 2 ^ n menghasilkan pohon binomial dengan area yang tidak memiliki massa kemungkinan. Ini memberi kita kurtosis.
Tanggapan terhadap komentar:
Ketika saya berbicara tentang menentukan jumlah bin, bulatkan ke bilangan bulat berikutnya.
Mesin Quincunx menjatuhkan bola yang akhirnya mendekati distribusi normal melalui binomial. Beberapa asumsi dibuat oleh mesin seperti itu: 1) jumlah nampan terbatas, 2) pohon yang mendasarinya biner, dan 3) probabilitasnya tetap. Mesin Quincunx di Museum Matematika di New York, memungkinkan pengguna mengubah probabilitas secara dinamis. Peluangnya dapat berubah kapan saja, bahkan sebelum lapisan saat ini selesai. Karenanya ide tentang tempat sampah ini tidak terisi.
Tidak seperti apa yang saya katakan dalam jawaban asli saya ketika Anda memiliki kekosongan di pohon, distribusi menunjukkan kurtosis.
Saya melihat ini dari perspektif sistem generatif. Saya menggunakan segitiga untuk merangkum pohon keputusan. Ketika keputusan baru dibuat, lebih banyak nampan ditambahkan di dasar segitiga, dan dalam hal distribusi, di ekor. Memotong sub pohon dari pohon akan membuat kekosongan dalam massa probabilitas distribusi.
Saya hanya menjawab untuk memberi Anda rasa intuitif. Label? Saya telah menggunakan Excel dan bermain dengan probabilitas di binomial dan menghasilkan kemiringan yang diharapkan. Saya belum melakukannya dengan kurtosis, itu tidak membantu bahwa kita dipaksa untuk berpikir tentang massa probabilitas sebagai statis saat menggunakan bahasa yang menyarankan gerakan. Data atau bola yang mendasarinya menyebabkan kurtosis. Kemudian, kami menganalisanya dengan beragam dan mengaitkannya dengan istilah deskriptif seperti pusat, bahu, dan ekor. Satu-satunya hal yang harus kita kerjakan adalah tempat sampah. Sampah menjalani kehidupan yang dinamis bahkan jika data tidak bisa.
sumber