Mengapa tes Mantel lebih disukai daripada Moran's I?

37

Uji Mantel digunakan secara luas dalam penelitian biologi untuk menguji korelasi antara distribusi spasial hewan (posisi dalam ruang) dengan, misalnya, keterkaitan genetiknya, tingkat agresi atau beberapa atribut lainnya. Banyak jurnal yang baik menggunakannya ( PNAS, Perilaku Hewan, Ekologi Molekuler ... ).

Saya membuat beberapa pola yang mungkin terjadi di alam, tetapi tes Mantel tampaknya tidak berguna untuk mendeteksi mereka. Di sisi lain, Moran's I memiliki hasil yang lebih baik (lihat nilai-p di bawah setiap plot) .

Mengapa para ilmuwan tidak menggunakan Moran's I sebagai gantinya? Apakah ada alasan tersembunyi yang tidak saya lihat? Dan jika ada beberapa alasan, bagaimana saya bisa tahu (bagaimana hipotesis harus dikonstruksi secara berbeda) untuk secara tepat menggunakan uji Mantel atau Moran? Contoh kehidupan nyata akan sangat membantu.

Bayangkan situasi ini: Ada kebun (17 x 17 pohon) dengan seekor gagak duduk di setiap pohon. Tingkat "kebisingan" untuk setiap gagak tersedia dan Anda ingin tahu apakah distribusi spasial gagak ditentukan oleh kebisingan yang dihasilkannya.

Ada (setidaknya) 5 kemungkinan:

  1. "Burung-burung dari bulu berkumpul bersama." Semakin mirip burung gagak, semakin kecil jarak geografis di antara mereka (satu kelompok) .

  2. "Burung-burung dari bulu berkumpul bersama." Sekali lagi, semakin mirip gagak, semakin kecil jarak geografis di antara mereka, (beberapa kluster) tetapi satu kluster gagak berisik tidak memiliki pengetahuan tentang keberadaan kluster kedua (jika tidak mereka akan bergabung menjadi satu kluster besar).

  3. "Tren monoton."

  4. "Ketertarikan yang berlawanan." Gagak yang serupa tidak dapat saling berdiri.

  5. "Pola acak." Tingkat kebisingan tidak berpengaruh signifikan terhadap distribusi spasial.

Untuk setiap kasus, saya membuat plot poin dan menggunakan tes Mantel untuk menghitung korelasi (tidak mengherankan bahwa hasilnya tidak signifikan, saya tidak akan pernah mencoba menemukan hubungan linier di antara pola-pola poin tersebut).

masukkan deskripsi gambar di sini


Contoh data: (dikompresi mungkin)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Membuat matriks jarak geografis (untuk Moran's I terbalik):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Pembuatan plot:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS dalam contoh-contoh di situs bantuan statistik UCLA, kedua tes digunakan pada data yang sama persis dan hipotesis yang sama persis, yang tidak terlalu membantu (lih., Uji Mantel , Moran's I ).

Tanggapan untuk IM Anda telah menulis:

... itu [Mantel] menguji apakah gagak yang tenang terletak di dekat gagak yang tenang lainnya, sementara gagak yang bising memiliki tetangga yang berisik.

Saya pikir hipotesis seperti itu TIDAK bisa diuji dengan uji Mantel . Pada kedua plot hipotesis tersebut valid. Tetapi jika Anda mengira bahwa satu kelompok gagak yang tidak berisik mungkin tidak memiliki pengetahuan tentang keberadaan kelompok kedua gagak yang tidak berisik - Tes mantel tidak lagi berguna. Pemisahan seperti itu harus sangat mungkin terjadi (terutama ketika Anda melakukan pengumpulan data dalam skala yang lebih besar).

masukkan deskripsi gambar di sini

Ladislav Naďo
sumber

Jawaban:

19

Mantel test dan Moran's I merujuk pada dua konsep yang sangat berbeda.

Alasan menggunakan Moran's I adalah pertanyaan tentang autokorelasi spasial: korelasi variabel dengan dirinya sendiri melalui ruang. Seseorang menggunakan Moran's I ketika ingin mengetahui sejauh mana terjadinya suatu peristiwa di unit areal membuat lebih mungkin atau tidak mungkin terjadinya suatu peristiwa di unit areal tetangga. Dengan kata lain (menggunakan contoh Anda): jika ada gagak berisik di pohon, seberapa besar atau tidak mungkin ada gagak berisik lainnya di lingkungan itu? Hipotesis nol untuk Moran's I adalah bukan autokorelasi spasial dalam variabel bunga.

Alasan untuk menggunakan uji Mantel adalah pertanyaan tentang persamaan atau perbedaan antara variabel. Seseorang menggunakan uji Mantel ketika ingin mengetahui apakah sampel yang serupa dalam hal variabel prediktor (spasi) juga cenderung serupa dalam hal variabel dependen (spesies). Singkatnya: Apakah sampel yang berdekatan juga memiliki komposisi yang sama dan apakah sampel yang jaraknya satu sama lain juga berbeda secara komposisi? Menggunakan contoh Anda: ini menguji apakah gagak yang tenang berada di dekat gagak yang tenang lainnya, sementara gagak yang bising memiliki tetangga yang berisik. Hipotesis nol adalah tidak ada hubungan antara lokasi spasial dan DV.
Selain itu, uji Mantel parsial memungkinkan membandingkan dua variabel sambil mengontrol yang ketiga.
Misalnya, seseorang perlu uji Mantel ketika membandingkan

  • Dua kelompok organisme, yang membentuk set unit sampel yang sama;
  • Struktur komunitas sebelum dan sesudah gangguan;
  • Jarak genetik / ekologis dan jarak geografis.

Berikut ini adalah diskusi yang bagus tentang tes Mantel dan aplikasinya.

(Diedit sebagai tanggapan terhadap contoh-contoh baru Ladislav Nado)

Jika saya bisa menebak, alasan untuk kebingungan Anda adalah bahwa Anda terus memikirkan ruang dan kebisingan dalam contoh Anda baik dari dua variabel kontinu, atau sebagai satu matriks jarak (posisi dalam ruang) dan satu variabel kontinu (noise). Bahkan, untuk menganalisis kesamaan antara dua variabel tersebut, kita harus menganggap keduanya sebagai matriks jarak . Itu adalah:

  • satu matriks (misalnya, untuk ruang) menjelaskan perbedaan untuk setiap pasangan koordinat geografis. Nilai untuk 2 gagak yang duduk bersebelahan lebih rendah dari nilai untuk gagak yang duduk berjauhan;
  • matriks lain (untuk lingkungan, genetik, atau struktur lainnya) menggambarkan perbedaan antara hasil yang diukur pada titik tertentu. Nilai untuk 2 gagak dengan tingkat kebisingan yang sama (tidak masalah apakah mereka tenang atau berisik - itu hanya ukuran kesamaan!) Lebih rendah daripada nilai untuk sepasang gagak dengan tingkat kebisingan yang berbeda.

Kemudian uji Mantel menghitung produk silang dari nilai yang sesuai dalam dua matriks ini. Izinkan saya menggarisbawahi lagi bahwa statistik Mantel adalah korelasi antara dua matriks jarak dan tidak setara dengan korelasi antara variabel , yang digunakan untuk membentuk matriks tersebut.

Sekarang mari kita ambil dua struktur yang Anda tunjukkan dalam gambar A dan B.
Dalam gambar A, jarak di setiap pasang gagak sesuai dengan kesamaan tingkat kebisingannya. Gagak dengan perbedaan kecil dalam tingkat kebisingan mereka (setiap gagak yang tenang vs gagak yang tenang, setiap gagak yang bising vs gagak yang bising lainnya) tetap dekat, sementara masing-masing dan setiap pasangan gagak dengan perbedaan besar dalam tingkat kebisingan mereka (gagak yang tenang vs. burung gagak yang berisik) menjauh satu sama lain. Uji Mantel dengan benar menunjukkan bahwa ada korelasi spasial antara kedua matriks.
Namun dalam gambar B, jarak antara gagak tidaksesuai dengan kesamaan tingkat kebisingan mereka. Sementara semua gagak yang bising tetap bersama, gagak yang tenang mungkin atau mungkin tidak tetap dekat. Bahkan, jarak dalam beberapa pasang gagak yang berbeda (satu tenang + satu berisik) lebih kecil dari jarak untuk beberapa pasang gagak yang sama (ketika keduanya diam).
Tidak ada bukti dalam gambar B bahwa jika seorang peneliti mengambil dua gagak yang sama secara acak, mereka akan menjadi tetangga. Tidak ada bukti bahwa jika seorang peneliti mengambil dua gagak tetangga (atau tidak begitu jauh) secara acak, mereka akan serupa. Makanya, klaim awal itu On both plots the hypothesis validsalah. Struktur seperti pada gambar B tidak menunjukkan korelasi spasial antara kedua matriks dan karenanya gagal dalam uji Mantel.

Tentu saja, berbagai jenis struktur (dengan satu atau lebih kelompok benda serupa atau tanpa batas gugus yang jelas sama sekali) ada dalam kenyataan. Dan uji Mantel sangat berlaku dan sangat berguna untuk menguji apa yang diuji. Jika saya dapat merekomendasikan bacaan baik lainnya, artikel ini menggunakan data nyata dan membahas Moran's I, Geary c, dan tes Mantel dalam istilah yang cukup sederhana dan mudah dimengerti.

Semoga semuanya sedikit lebih jelas sekarang; meskipun, saya dapat memperluas penjelasan ini jika Anda merasa masih ada sesuatu yang hilang.

SAYA M
sumber
1
terima kasih atas jawaban Anda, tapi saya pikir hipotesis yang Anda tulis (dari hipotesis uji Mantel nyata) tidak berguna dengan data kehidupan nyata. Saya menambahkan respons saya kepada Anda di atas, saya akan sangat senang jika Anda menanggapinya. Mungkin saya salah.
Ladislav Naďo
@ Ladislav Nado Saya sudah memperbarui jawabannya. Harap jangan ragu untuk meminta penjelasan lebih lanjut, jika perlu.
IM
Terima kasih banyak, ketika saya "mengunyah" artikel yang Anda rekomendasikan akhirnya saya mengerti.
Ladislav Naďo
1
@LadislavNado Hebat! Senang bisa membantu.
IM