Bagaimana menafsirkan nilai F dan p dalam ANOVA?

40

Saya baru mengenal statistik dan saat ini saya berurusan dengan ANOVA. Saya melakukan tes ANOVA di R menggunakan

aov(dependendVar ~ IndependendVar)

Saya mendapatkan - antara lain - nilai-F dan nilai-p.

Hipotesis nol saya ( ) adalah bahwa semua rata-rata grup sama.H0

Ada banyak informasi yang tersedia tentang bagaimana F dihitung , tetapi saya tidak tahu cara membaca F-statistik dan bagaimana F dan p terhubung.

Jadi, pertanyaan saya adalah:

  1. Bagaimana cara menentukan nilai-F kritis untuk menolak ?H0
  2. Apakah masing-masing F memiliki nilai-p yang sesuai, sehingga pada dasarnya keduanya sama? (misalnya, jika , maka ditolak)p<0.05H0
JanD
sumber
1
Apakah Anda mencoba perintah summary(aov(dependendVar ~ IndependendVar)))atau summary(lm(dependendVar ~ IndependendVar))? Apakah maksud Anda semua rata-rata grup sama satu sama lain dan sama dengan 0 atau hanya satu sama lain?
RyanB
ya, saya memang mencoba summary(aov...). Terima kasih untuk lm.*, tidak tahu tentang ini :-) Saya tidak mendapatkan apa yang Anda maksud dengan sama dengan 0. Jika itu singkat untuk 0-Hipotesis saya daripada Hipotesis akan membutuhkan nilai, dan saya tidak menguji pada yang spesifik, jadi dalam hal ini: hanya untuk satu sama lain!
JanD
1
Untuk penjelasan intuitif, lihat blog Yhat tentang topik regresi.
DataTx

Jawaban:

14

Untuk menjawab pertanyaan Anda:

  1. Anda menemukan nilai F kritis dari distribusi F (di sini adalah tabel ). Lihat sebuah contoh . Anda harus berhati-hati tentang kebebasan pembilang dan penyebut satu arah lawan dua arah.

  2. Iya nih.

makan siang
sumber
Tidaklah berarti membicarakan perbandingan satu atau dua arah dalam tes omnibus seperti uji-F.
Marcus Morrisey
3
Marcus Morrisey: Saya pikir Anda membingungkan satu vs dua ekor dengan satu arah vs dua arah. Uji-F tidak memiliki beberapa "ekor" untuk dipilih, tetapi ANOVA satu arah vs ANOVA dua arah perlu dipertimbangkan ketika menyusun statistik uji.
Emiller
29

Statistik F adalah rasio 2 ukuran varians yang berbeda untuk data. Jika hipotesis nol itu benar maka keduanya adalah perkiraan dari hal yang sama dan rasionya adalah sekitar 1.

Pembilang dihitung dengan mengukur varians dari rata-rata dan jika rata-rata sebenarnya dari kelompok adalah identik maka ini adalah fungsi dari keseluruhan varians data. Tetapi jika hipotesis nol salah dan artinya tidak semua sama, maka ukuran varians ini akan lebih besar.

Penyebut adalah rata-rata dari varians sampel untuk setiap kelompok, yang merupakan estimasi dari keseluruhan varians populasi (dengan asumsi semua kelompok memiliki varians yang sama).

Jadi ketika nol dari semua berarti sama adalah benar maka 2 ukuran (dengan beberapa istilah tambahan untuk derajat kebebasan) akan sama dan rasio akan mendekati 1. Jika nol adalah salah, maka pembilangnya akan relatif besar dibandingkan dengan penyebut dan rasio akan lebih besar dari 1. Mencari rasio ini pada tabel-F (atau menghitungnya dengan fungsi seperti pf dalam R) akan memberikan nilai-p.

Jika Anda lebih suka menggunakan wilayah penolakan daripada nilai p, maka Anda bisa menggunakan tabel F atau fungsi qf di R (atau perangkat lunak lain). Distribusi F memiliki 2 jenis derajat kebebasan. Tingkat pembilang kebebasan didasarkan pada jumlah kelompok yang Anda bandingkan (untuk 1-arah itu adalah jumlah kelompok minus 1) dan derajat kebebasan penyebut didasarkan pada jumlah pengamatan dalam kelompok (untuk 1- caranya adalah jumlah pengamatan dikurangi jumlah kelompok). Untuk model yang lebih rumit, derajat kebebasan menjadi lebih rumit, tetapi ikuti ide serupa.

Greg Snow
sumber
Terima kasih untuk penjelasannya! Saya berasumsi bahwa jika saya dapat mencari nilai F pada tabel untuk melihat nilai-p, maka nilai p dan F hanyalah dua cara untuk menyatakan kemungkinan bahwa hasil seperti yang dianalisis dapat terjadi jika H0 benar?
JanD
2
Dalam semua statistik parametrik ada hubungan fungsional langsung antara statistik uji (F dalam kasus ini) dan nilai-p. Ini telah dimasukkan ke dalam tabel untuk kenyamanan, tetapi juga dapat dihitung secara langsung. Anda dapat menggunakan alfa untuk menemukan cut-off untuk wilayah kritis untuk membandingkan statistik uji dengan (yang saya pikir lebih intuitif) atau menggunakan statistik uji yang dihitung untuk menemukan nilai-p untuk membandingkan dengan alfa. Dalam kedua kasus ini, kita mulai dengan level alfa dan rumus statistik pengujian yang mengikuti distribusi yang diberikan ketika nol benar.
Greg Snow
20

Fp

masukkan deskripsi gambar di sini

FFFpFFpFp

Anda harus memperhatikan beberapa hal lain tentang distribusi di bawah hipotesis nol:

F

F

CCFCpp=0.175

FFdf1=3df1=2

masukkan deskripsi gambar di sini

Fχ2χ2Fχ2zFtt

Itu jauh lebih banyak daripada yang saya maksudkan untuk mengetik, tapi saya harap itu mencakup pertanyaan Anda!

(Jika Anda bertanya-tanya dari mana diagram berasal, mereka dihasilkan secara otomatis oleh paket statistik desktop saya, Wizard .)

Emiller
sumber