Apa perbedaan antara skor-Z dan nilai-p?

11

Dalam algoritme motif jaringan, tampaknya cukup umum untuk mengembalikan nilai-p dan skor-Z untuk statistik: "Jaringan input berisi salinan X subgraph G". Subgraph dianggap sebagai motif jika memenuhi

  • p-value <A,
  • Z-score> B dan
  • X> C, untuk beberapa A, B dan C. yang ditentukan pengguna (atau yang ditentukan komunitas)

Ini memotivasi pertanyaan:

Pertanyaan : Apa perbedaan antara nilai-p dan skor-Z?

Dan pertanyaannya:

Pertanyaan : Apakah ada situasi di mana nilai-p dan skor-Z dari statistik yang sama mungkin menunjukkan hipotesis yang berlawanan? Apakah kondisi pertama dan kedua yang tercantum di atas pada dasarnya sama?

Douglas S. Stones
sumber

Jawaban:

9

Saya akan mengatakan, berdasarkan pertanyaan Anda, bahwa tidak ada perbedaan antara ketiga tes. Ini adalah dalam arti bahwa Anda selalu dapat memilih A, B, dan C sehingga keputusan yang sama tiba pada terlepas dari kriteria apa yang Anda gunakan. Meskipun Anda perlu memiliki nilai-p didasarkan pada statistik yang sama (yaitu skor-Z)

Untuk Menggunakan skor-Z, baik mean dan varians σ 2 diasumsikan diketahui, dan distribusi diasumsikan normal (atau asimptotik / mendekati normal). Misalkan kriteria p-value adalah 5% biasa. Maka kita memiliki:μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

Jadi kita memiliki triple yang semuanya mewakili cut-off yang sama.(0.05,1.645,μ+1.645σ)

Perhatikan bahwa korespondensi yang sama akan berlaku untuk uji-t, meskipun angkanya akan berbeda. Tes dua ekor juga akan memiliki korespondensi yang serupa, tetapi dengan angka yang berbeda.

probabilityislogic
sumber
Terima kasih untuk itu! (dan terima kasih kepada penjawab lain juga).
Douglas S. Stones
8

Sebuah -score menjelaskan penyimpangan Anda dari mean dalam satuan deviasi standar. Tidak eksplisit apakah Anda menerima atau menolak hipotesis nol Anda.Z

Nilai adalah probabilitas bahwa di bawah hipotesis nol kita dapat mengamati titik yang sama ekstremnya dengan statistik Anda. Ini secara eksplisit memberi tahu Anda apakah Anda menolak atau menerima hipotesis nol Anda yang diberikan ukuran tes α .pα

XN(μ,1)μ=0x1=5Zσpα=0.05p<αAB

Gary
sumber
3
2σ3σ
Zp
H0:μ=0HA:μ=1H05×107μ=1. Tapi ini tidak masuk akal, tidak ada yang akan melakukan ini, tetapi aturan p-value yang Anda gunakan di sini melakukan ini. Dengan kata lain, aturan p-value yang Anda gambarkan tidak invarian terkait dengan apa yang disebut "hipotesis nol" (resolusi akan datang)
probabilityislogic
Himp:μ=5HA1×109H0
probabilityislogic
1
H1:μ0H1P(X|μ1)
6

pz

pzzp

SheldonCooper
sumber
jika ukuran sampel besar, maka standar deviasi akan kecil, maka skor-Z akan tinggi. Saya pikir Anda dapat menemukan ini jika Anda mencoba contoh numerik.
probabilityislogic
1
Tidak juga. Misalkan Anda sampel dari N (0, 1). Maka std Anda akan menjadi sekitar 1 terlepas dari ukuran sampel. Yang akan menjadi lebih kecil adalah kesalahan standar rata-rata, bukan standar deviasi. p-nilai didasarkan pada SEM, bukan pada std.
SheldonCooper
Z-score adalah (rata-rata yang diamati) / (standar deviasi). Tetapi mean dan standar deviasi adalah dari statistik yang diamati, bukan dari populasi dari mana komponen itu diambil. Terminologi kendur saya telah tertangkap di sini. Namun, jika Anda menguji mean, maka standar deviasi yang sesuai dalam skor-Z adalah kesalahan standar, yang menjadi lebih kecil pada tingkat yang sama dengan nilai-p.
probabilityislogic