Perbedaan antara Cohen d dan Hedges 'g untuk metrik ukuran efek

19

Untuk analisis ukuran efek, saya memperhatikan bahwa ada perbedaan antara Cohen d, Hedges's g dan Hedges 'g *.

  • Apakah ketiga metrik ini biasanya sangat mirip?
  • Apa yang akan menjadi kasus di mana mereka akan menghasilkan hasil yang berbeda?
  • Juga apakah ini masalah preferensi yang saya gunakan atau laporkan?
Elpezmuerto
sumber
1
Dalam hal ini berguna untuk formula penjawab potensial tercantum di sini: en.wikipedia.org/wiki/Effect_size
Jeromy Anglim
Simulasi dalam R dengan perbedaan n1, n2, s1, s2, dan populasi akan menjadi latihan yang bagus. Siapa saja?
Jeromy Anglim
1
Materi ini juga dibahas di sini: Apa perbedaan antara Hedges 'g dan Cohen d .
gung - Reinstate Monica

Jawaban:

18

Varians g pool Cohen d dan Hedges berdasarkan asumsi varians populasi yang sama, tetapi g pool menggunakan n - 1 untuk setiap sampel, bukan n, yang memberikan perkiraan yang lebih baik, terutama semakin kecil ukuran sampel. Baik d dan g agak bias positif, tetapi hanya diabaikan untuk ukuran sampel sedang atau lebih besar. Bias dikurangi menggunakan g *. The d oleh Glass tidak mengasumsikan varians yang sama, jadi ia menggunakan sd dari kelompok kontrol atau kelompok pembanding garis dasar sebagai standarisasi untuk perbedaan antara dua cara.

Ukuran efek ini dan ukuran efek Cliff dan nonparametrik lainnya dibahas secara rinci dalam buku saya:

Grissom, RJ, & Kim, J, J. (2005). Ukuran efek untuk penelitian: Pendekatan praktis yang luas. Mahwah, NJ: Erlbaum.

Robert J. Grissom
sumber
8

Menurut pemahaman saya, Hedges's g adalah versi yang agak lebih akurat dari Cohen d (dengan pooled SD) di mana kami menambahkan faktor koreksi untuk sampel kecil. Kedua langkah umumnya setuju ketika asumsi homoseksualitas tidak dilanggar, tetapi kami dapat menemukan situasi di mana ini tidak terjadi, lihat misalnya McGrath & Meyer, Metode Psikologis 2006, 11 (4) : 386-401 ( pdf ). Makalah lain tercantum di akhir balasan saya.

Saya umumnya menemukan bahwa di hampir setiap studi psikologis atau biomedis, ini adalah Cohen yang dilaporkan; ini mungkin berdiri dari aturan praktis yang terkenal untuk menafsirkan besarnya (Cohen, 1988). Saya tidak tahu tentang tulisan terbaru yang mempertimbangkan Hedges's g (atau Cliff delta sebagai alternatif non-parametrik). Bruce Thompson memiliki versi revisi dari bagian APA pada ukuran efek.

Googling tentang studi Monte Carlo di sekitar ukuran efek, saya menemukan makalah ini yang mungkin menarik (saya hanya membaca abstrak dan pengaturan simulasi): Interval Keyakinan Kuat untuk Ukuran Efek: Studi Banding Cohen d dan Cliff's Delta Under Non-normality dan Varian Heterogen (pdf).

Tentang komentar kedua Anda, MBESSpaket R mencakup berbagai utilitas untuk penghitungan ES (mis., smdDan fungsi terkait).

Referensi lain

  1. Zakzanis, KK (2001). Statistik untuk mengatakan kebenaran, seluruh kebenaran, dan tidak ada yang lain selain kebenaran: Formula, contoh numerik ilustratif, dan interpretasi heuristik dari analisis ukuran efek untuk peneliti neuropsikologis. Archives of Clinical Neuropsychology , 16 (7), 653-667. ( pdf )
  2. Durlak, JA (2009). Cara Memilih, Menghitung, dan Menafsirkan Ukuran Efek. Jurnal Psikologi Anak ( pdf )
chl
sumber
2
Seorang pengguna anonim ingin menambahkan definisi homoseksualitas berikut bagi mereka yang mungkin tidak terbiasa dengan istilah: "properti dari serangkaian variabel acak di mana setiap variabel memiliki varian terbatas yang sama".
gung - Reinstate Monica
5

Tampaknya ketika orang mengatakan Cohen d yang paling mereka maksudkan adalah:

d=x¯1-x¯2s

s

s=(x1-x¯1)2+(x2-x¯2)2n1+n2-2

Ada penaksir lain untuk standar deviasi gabungan, mungkin yang paling umum selain dari yang di atas adalah:

s=(x1-x¯1)2+(x2-x¯2)2n1+n2

sn1+n2dgss

Di lain waktu, Hedge's g disediakan untuk merujuk pada salah satu versi bias yang diperbaiki dari perbedaan rata-rata terstandarisasi yang dikembangkan Hedges. Hedges (1981) menunjukkan bahwa Cohen d bias ke atas (yaitu, nilai yang diharapkan lebih tinggi dari nilai parameter populasi sebenarnya), terutama dalam sampel kecil, dan mengusulkan faktor koreksi untuk mengoreksi bias Cohen d:

Hedges's g (penaksir tidak bias):

g=d(Γ(df/2)df/2Γ((df-1)/2))
df=n1+n2-2Γ

Namun, faktor koreksi ini cukup kompleks secara komputasional, sehingga Hedges juga memberikan perkiraan sepele secara komputasional yang, meskipun masih sedikit bias, baik untuk hampir semua tujuan yang mungkin:

g

g=d(1-34(df)-1)
df=n1+n2-2

(Originally from Hedges, 1981, versi ini dari Borenstein, Hedges, Higgins, & Rothstein, 2011, hlm. 27)

gg

n>20

Referensi:

Borenstein, M., Hedges, LV, Higgins, JP, & Rothstein, HR (2011). Pengantar Meta-Analisis. Sussex Barat, Inggris Raya: John Wiley & Sons.

Cohen, J. (1977). Analisis kekuatan statistik untuk ilmu perilaku (2nd ed.). Hillsdale, NJ, AS: Lawrence Erlbaum Associates, Inc.

Hedges, LV (1981). Teori Distribusi untuk Estimator Kaca dari Efek ukuran dan Estimator Terkait. Jurnal Statistik Pendidikan, 6 (2), 107-128. doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Metode statistik untuk meta-analisis. San Diego, CA: Academic Press

FelixST
sumber
3

Jika Anda hanya mencoba memahami arti dasar Hedges 'g, seperti saya, Anda mungkin juga akan terbantu:

Besarnya Hedges 'g dapat ditafsirkan menggunakan konvensi Cohen (1988 [2]) sebagai kecil (0,2), sedang (0,5), dan besar (0,8). [1]

Definisi mereka pendek dan jelas:

Hedges 'g adalah variasi Cohen d yang mengoreksi bias karena ukuran sampel yang kecil (Hedges & Olkin, 1985). [1] catatan kaki

Saya akan menghargai para ahli statistik yang mengedit ini untuk menambahkan peringatan penting apa pun pada klaim kecil (0,2) menengah (0,5) dan besar (0,8), untuk membantu para pakar menghindari menghindari salah mengartikan angka Hedges yang digunakan dalam penelitian ilmu sosial dan psikologi.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Pengaruh Terapi Berbasis Perhatian terhadap Kecemasan dan Depresi: Tinjauan Meta-Analitik Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt, dan Diana Oh. J Consult Clin Psychol. 2010 April; 78 (2): 169–183. doi: 10.1037 / a0018555

[2] Analisis kekuatan statistik Cohen J. untuk ilmu perilaku. 2nd ed. Erlbaum; Hillsdale, NJ: 1988 (dikutip dalam [1])

cepat
sumber
4
+1. Re: kecil-sedang-besar, sebagai pass pertama, jika Anda tidak memiliki pengetahuan atau konteks yang relevan, 'ukuran t-shirt' ini OK, tetapi dalam kenyataannya, apa efek kecil atau besar akan bervariasi berdasarkan disiplin atau topik . Selain itu, hanya karena efeknya 'besar' tidak berarti itu praktis penting atau bermakna secara teoritis.
gung - Reinstate Monica
1

Poster-poster lain telah membahas masalah persamaan dan perbedaan antara g dan d. Hanya untuk menambah ini, beberapa sarjana merasa bahwa nilai ukuran efek yang ditawarkan oleh Cohen terlalu murah hati yang mengarah pada interpretasi berlebihan dari efek lemah. Mereka juga tidak terikat pada r mengarah ke kemungkinan sarjana dapat mengkonversi bolak-balik untuk mendapatkan ukuran efek yang lebih baik ditafsirkan. Ferguson (2009, Psikologi Profesional: Penelitian dan PRAKTEK) menyarankan menggunakan nilai-nilai berikut untuk interpretasi untuk g:

0,41, sebagai rekomendasi minimum untuk "signifikansi praktis." 1,15, efek moderat 2,70, efek kuat

Ini jelas lebih keras / sulit untuk dicapai dan tidak banyak percobaan ilmu sosial akan mendapatkan efek yang kuat ... yang mungkin memang seharusnya demikian.

Perjalanan waktu
sumber
0

Bruce Thompson memperingatkan tentang menggunakan Cohen (0,2) sebagai kecil (0,5) sebagai sedang dan (0,8) sebagai besar. Cohen tidak pernah bermaksud agar ini digunakan sebagai interpretasi yang kaku. Semua ukuran efek harus ditafsirkan berdasarkan konteks literatur terkait. Jika Anda menganalisis ukuran efek terkait yang dilaporkan pada topik Anda dan itu adalah (0,1) (0,3) (0,24) dan Anda menghasilkan efek (0,4) maka itu mungkin "besar". Sebaliknya, jika semua literatur terkait memiliki efek (0,5) (0,6) (0,7) dan Anda memiliki efek (0,4) mungkin dianggap kecil. Saya tahu ini adalah contoh sepele tetapi sangat penting. Saya percaya Thompson pernah menyatakan dalam sebuah makalah, "Kami hanya akan bodoh dalam metrik yang berbeda" ketika membandingkan interpretasi ukuran efek dengan bagaimana para ilmuwan sosial menafsirkan nilai p pada saat itu.

pengguna136666
sumber