Apa derajat kebebasan suatu distribusi?

10

Saya berurusan sekarang dengan banyak distribusi, misalnya, , , .Ftχ2

Saya bertanya-tanya mengapa derajat kebebasan ini menandakan distribusi seperti distribusi ?F(m,n)

Le Max
sumber
3
Silakan lihat stats.stackexchange.com/questions/16921/… . Jawaban yang paling langsung menjawab pertanyaan Anda adalah stats.stackexchange.com/a/16931 ; jawaban lainnya memberikan berbagai penyempurnaan dan cara tambahan untuk memahami tingkat kebebasan. Di tempat lain di Web, akun terbaik yang dapat saya temukan dari keluarga distribusi ini adalah di rip94550.wordpress.com/2012/07/30/… . Penjelasan yang lebih baik muncul dalam teks; favorit saya adalah JC Kiefer, Intro. ke Stat. Inferensi , hlm 265 dan seq.
whuber
@maximus whuber memberikan jawaban yang sangat terperinci di tautan keduanya. Sangat menarik karena berbicara tentang semua kesalahpahaman dan definisi buruk yang diberikan dari bagian wikipedia yang dikutip dalam posting itu.
Michael R. Chernick

Jawaban:

12

Berikut adalah jawaban yang kurang teknis, mungkin lebih mudah diakses oleh orang-orang dengan persiapan matematika sederhana.

Istilah derajat kebebasan (df) digunakan sehubungan dengan berbagai statistik uji tetapi maknanya bervariasi dari satu uji statistik ke yang berikutnya. Beberapa tes tidak memiliki derajat kebebasan yang terkait dengan statistik uji (misalnya, Fisher Exact Test atau z test). Ketika kita melakukan uji az, nilai z yang kita hitung berdasarkan data kita dapat ditafsirkan berdasarkan tabel tunggal dari nilai z kritis, tidak peduli seberapa besar atau kecil sampel kita. Cara lain untuk mengatakan ini adalah bahwa ada satu distribusi z. Tidak demikian untuk beberapa tes lain (mis. F atau t atau χ2).

Alasan mengapa banyak statistik uji perlu ditafsirkan berdasarkan df adalah bahwa distribusi (secara teoritis) nilai-nilai statistik uji, dengan asumsi hipotesis nol itu benar, tergantung pada ukuran sampel atau jumlah kelompok, atau keduanya, atau beberapa fakta lain tentang data yang dikumpulkan. Dalam melakukan uji-t, distribusi nilai t tergantung pada ukuran sampel, jadi ketika kami mengevaluasi nilai t yang kami hitung dari data yang diamati, kami perlu membandingkannya dengan nilai t yang diharapkan berdasarkan ukuran sampel yang sama dengan data kami. Demikian pula, distribusi nilai F dalam Analisis Varians (dengan asumsi hipotesis nol adalah benar) tergantung pada ukuran sampel dan jumlah kelompok. Jadi untuk menginterpretasikan nilai F yang kami hitung dari data kami, kami perlu menggunakan tabel nilai F yang didasarkan pada ukuran sampel yang sama dan jumlah kelompok yang sama seperti yang kami miliki dalam data kami. Mengatakan ini secara berbeda, uji F (yaitu, ANOVA) dan uji-t dan uji each2 masing-masing membutuhkan keluarga kurva untuk membantu kami menginterpretasikan nilai t atau F atau χ2 yang kami hitung berdasarkan data kami. Kami memilih di antara keluarga-keluarga kurva ini berdasarkan nilai-nilai (mis. Df) sehingga probabilitas yang kami baca dari tabel sesuai untuk data kami. (Tentu saja, sebagian besar program komputer melakukan ini untuk kita.)

Joel W.
sumber
3
+1 Pekerjaan yang sangat luar biasa untuk melihat ke dalam inti praktis masalah ini dan menjelaskannya dengan jelas.
whuber
0

Distribusi F adalah rasio dari dua distribusi chi-square pusat. M adalah derajat kebebasan yang terkait dengan variabel acak chi-square yang mewakili pembilang dan n adalah derajat kebebasan chi-square untuk penyebut. Untuk melengkapi jawaban atas pertanyaan Anda, saya perlu menjelaskan derajat kebebasan chi-square. Distribusi chi-square dengan n derajat kebebasan dapat direpresentasikan sebagai jumlah kuadrat dari n variabel bebas N (0,1). Jadi derajat kebebasan dapat dilihat sebagai jumlah variabel acak normal yang muncul dalam jumlah.

Sekarang ini akan berubah jika normals ini menyertakan estimasi parameter. Misalkan kita memiliki n variabel bebas N (m, 1) acak X i i = 1,2, ..., n. Kemudian biarkan X menjadi mean sampel = X / n. ibi

Sekarang hitung S = ∑ (X -X ) . S akan memiliki distribusi chi-square tetapi dengan n-1 derajat kebebasan. Dalam hal ini kita masih menjumlahkan variabel acak n, kuadrat N (0,1). Tetapi perbedaannya di sini adalah bahwa mereka tidak independen karena masing-masing dibentuk menggunakan X sama . Jadi untuk chi-square sering dikatakan bahwa derajat kebebasan sama dengan jumlah istilah dalam jumlah dikurangi jumlah parameter yang diperkirakan.2ib22b

Dalam kasus distribusi t kita memiliki N (0, σ ) dibagi dengan V di mana V adalah estimasi sampel σ. V sebanding dengan chi-square dengan n-1 derajat kebebasan di mana n adalah ukuran sampel. Derajat kebebasan untuk t adalah derajat kebebasan untuk variabel acak chi-square yang terlibat dalam perhitungan V.2

Michael R. Chernick
sumber