Tentukan apakah proses distribusi ekor berat telah meningkat secara signifikan

12

Saya mengamati waktu pemrosesan suatu proses sebelum dan sesudah perubahan untuk mengetahui, apakah proses tersebut telah membaik oleh perubahan tersebut. Proses telah meningkat, jika waktu pemrosesan berkurang. Distribusi waktu pemrosesan adalah berekor gemuk, jadi membandingkan berdasarkan rata-rata tidaklah masuk akal. Sebaliknya saya ingin tahu apakah probabilitas untuk mengamati waktu pemrosesan yang lebih rendah setelah perubahan secara signifikan di atas 50%.

Biarkan menjadi variabel acak untuk waktu pemrosesan setelah perubahan dan yang sebelumnya. Jika secara signifikan di atas maka saya akan mengatakan prosesnya telah membaik.Y P ( X < Y ) 0,5XYP(X<Y)0.5

Sekarang aku punya pengamatan dari dan pengamatan dari . The diamati probabilitas adalah .x i X m y j Y P ( X < Y ) p = 1nxiXmyjYP(X<Y)p^=1nmij1xi<yj

Apa yang bisa saya katakan tentang mengingat pengamatan dan ?x i y jP(X<Y)xiyj

Kristen
sumber

Jawaban:

12

Perkiraan Anda sama dengan statistik Mann-Whitney dibagi dengan (terima kasih, Glen!), Dan karenanya setara dengan statistik peringkat-jumlah Wilcoxon (juga dikenal sebagai statistik Wilcoxon-Mann-Whitney) : , di mana adalah ukuran sampel (dengan asumsi tidak ada ikatan.) Karena itu Anda dapat menggunakan tabel / perangkat lunak dari tes Wilcoxon dan mengubahnya kembali ke untuk mendapatkan interval kepercayaan atau nilai- .p^UmnWW=U+n(n+1)2nyUp

Biarkan menjadi ukuran sampel , = . Kemudian, tanpa gejala,mxNm+n

W=Wm(N+1)2mn(N+1)12N(0,1)

Sumber: Hollander dan Wolfe , Metode Statistik Nonparametrik, kira-kira hal. 117, tetapi mungkin sebagian besar buku statistik nonparametrik akan membawa Anda ke sana.

Jbowman
sumber
@ Glen_b - terima kasih, saya telah memperbarui jawabannya. Tebakan Anda yang sangat dermawan tentang penyebab kesalahan itu!
jbowman
13

@jbowman memberikan solusi standar (bagus) untuk masalah estimasi yang dikenal sebagai model kekuatan-tegangan .θ=P(X<Y)

Alternatif nonparametrik lain diusulkan dalam Baklizi dan Eidous (2006) untuk kasus di mana dan Y adalah independen. Ini dijelaskan di bawah ini.XY

Menurut definisi kita memilikinya

θ=P(X<Y)=FX(y)fY(y)dy,

di mana adalah CDF dari X dan f Y adalah kepadatan Y . Kemudian, dengan menggunakan sampel X dan Y kita dapat memperoleh estimator kernel dari F X dan f Y dan akibatnya dan estimator θFXXfYYXYFXfYθ

θ^=F^X(y)f^Y(y)dy.

Ini diimplementasikan dalam kode R berikut menggunakan kernel Gaussian.

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty =  rcauchy(100,0,1)

nonpest(datx,daty)

θ

# bootstrap
B=1000
p = rep(0,B)

for(j in 1:B){
dat1 =  sample(datx,length(datx),replace=T)
dat2 =  sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}

# histogram of the bootstrap sample
hist(p)

# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))

Jenis interval bootstrap lain mungkin dipertimbangkan juga.


sumber
2
Referensi kertas yang menarik dan bagus (+1). Saya akan menambahkannya ke repertoar saya!
jbowman
0

XiYiP(XiYi<0)=pI{XiYi<0}i=1,2,..,nXXi<Yin p=P(XiYi<0)X/n

Michael R. Chernick
sumber
2
Apa dasar dari pasangan itu, Michael?
whuber
OP mengatakan "Biarkan X menjadi variabel acak untuk waktu pemrosesan setelah perubahan dan Y yang sebelumnya" Jadi Xi adalah setelah intervensi dan Yi adalah sebelumnya.
Michael R. Chernick
m=nXiYj
1
Kamu benar. Saya kira semacam dua sampel uji seperti Wilcoxon seperti yang disarankan oleh jbowman di atas akan sesuai. Sangat menarik bahwa bentuk Mann-Whitney dan tes menghitung jumlah Xis <the Yjs.
Michael R. Chernick