Cara mengekspresikan sel-sel tabel 2x2 dalam hal koefisien phi dan probabilitas marginal

8

Pertimbangkan tabel frekuensi 2x2 yang umum (diperlihatkan dalam gambar ini): Notasi: Variabel baris dilambangkan R dan mengambil nilai 0 atau 1; variabel kolom dilambangkan C dan mengambil nilai 0 atau 1. Sel-sel tabel mengindikasikan frekuensi setiap kombinasi R dan C; misalnya, adalah frekuensi R = 0 dan C = 1. Untuk keperluan pertanyaan saya, asumsikan bahwa jumlah sel dibagi dengan total, sehingga nilai sel adalah probabilitas gabungan dari sel .
dua demi dua meja
b

Saya ingin menyatakan probabilitas sel dalam hal koefisien phi (yang merupakan ukuran korelasi dengan rumus yang disediakan di bawah) dan probabilitas marginal: dan . Yaitu, saya ingin membalikkan sistem empat persamaan berikut: dan, tentu saja, . Dengan kata lain, saya ingin menyelesaikan untuk a , b , c , dan d dalam halμRp(R=1)=c+dμCp(C=1)=b+d

(by defn)ϕ(adbc)/(a+b)(c+d)(a+c)(b+d)(by defn)μR=c+d(by defn)μC=b+d(constraint)1=a+b+c+d
0a,b,c,d1abcdϕ , , dan .μRμC

Masalah ini mungkin telah dipecahkan oleh seseorang sebelumnya, tetapi pencarian saya belum menghasilkan sumber, dan upaya aljabar saya yang lemah belum menghasilkan jawaban, dan saya tidak dapat menemukan inverter sistem-of- (nonlinear)-line yang menangani kasus ini .

John K. Kruschke
sumber

Jawaban:

4

Kami dengan mudah mengenali setiap faktor dalam penyebut , karena dan . Karena itu, mari kita mulai dengan penyederhanaan kecil untuk menghindari penulisan banyak akar kuadrat:ϕa+b=1μRa+c=1μC

Δ=adbc=ϕμR(1μR)μC(1μC).

Mari temukan :d

d=(1)d=(a+b+c+d)d=ad+bd+cd+d2=ad+(bc+bc)+bd+cd+d2=(adbc)+(c+d)(b+d)=Δ+μRμC.

Menemukan , , dan menghasilkan sama karena simetri masalah: menukar kolom menukar dan , dan , sambil mengubah menjadi dan meniadakan , di mana abcabcdμC1μCΔ

c=Δ+μR(1μC).

Menukar baris menukar dan , dan , sambil mengubah menjadi dan meniadakan , dari manaacbdμR1μRΔ

b=Δ+(1μR)μC.

Mengganti baris dan kolom menghasilkan

a=Δ+(1μR)(1μC).

Dengan ungkapan berikut untuk , mudah untuk memeriksa bahwa dan , dan hanya sedikit lebih sulit untuk verifikasi .a,b,c,da+b+c+d=1,c+d=μR,b+d=μCadbc=Δ

whuber
sumber
Satu catatan untuk orang lain yang mungkin menggunakan jawaban (benar!) Ini: Ini dapat menghasilkan nilai a, b, c, atau d yang negatif. Dengan kata lain, tidak semua kombinasi phi pada [-1,1], mu_R dalam [0,1], dan mu_C dalam [0,1] dapat dibuat dengan matriks probabilitas. Kepada Whuber: Terima kasih!
John K. Kruschke
Itu benar, John, tetapi saya tidak menyebutkan fakta itu karena mungkin , , dan telah diperoleh dari tabel yang valid. Dengan asumsi dan adalah frekuensi yang valid (dalam interval ), akan menjadi nyata. Itu harus terletak pada intervalμRμCϕμRμC[0,1]Δ
[min(μRμC,(1μR)(1μC)), min(μR(1μC),(1μR)μC)].
whuber