Apakah ada versi uji ekivalensi sederhana dari tes Kolmogorov-Smirnov?

13

Apakah dua tes sepihak untuk kesetaraan (TOST) telah dibingkai untuk uji Kolmogorov-Smirnov untuk menguji hipotesis nol negatif bahwa dua distribusi berbeda dengan setidaknya beberapa tingkat yang ditentukan peneliti?

Jika tidak TOST, lalu beberapa bentuk tes kesetaraan lainnya?

Nick Stauner dengan bijak menunjukkan bahwa (saya seharusnya sudah tahu;) bahwa ada tes kesetaraan TOST nonparametrik lainnya untuk hipotesis nol untuk kesetaraan stokastik, dan, dengan asumsi yang lebih ketat, untuk kesetaraan median.

Alexis
sumber

Jawaban:

9

Ok, ini usaha pertamaku. Tutup pengawasan dan komentar dihargai!

Hipotesa Dua Sampel
Jika kita dapat membingkai tes hipotesis Kolmogorov-Smirnov satu sisi dua sampel , dengan hipotesis nol dan alternatif di sepanjang baris berikut:

H 0F Y ( t )F X ( t ) , dan0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , untuk setidaknya satu t , di mana:AFY(t)<FX(t)t

  • statistik uji D - = | min t ( F Y ( t ) - F X ( t ) ) | D=|mint(FY(t)FX(t))| sesuai dengan H 0F Y ( t )F X ( t ) ;0FY(t)FX(t)

  • statistik uji D + = | maks. t ( F Y ( t ) - F X ( t ) ) | D+=|maxt(FY(t)FX(t))|sesuai dengan H 0F Y ( t )F X ( t ) ; dan0FY(t)FX(t)

  • F Y ( t )FY(t) & F X ( t )FX(t) adalah CDF empirisdari sampel YY dan XX ,

maka harus masuk akal untuk membuat hipotesis interval umum untuk uji kesetaraan di sepanjang garis ini (dengan asumsi bahwa interval kesetaraan simetris untuk saat ini):

H - 0| F Y ( t ) - F X ( t ) | Δ , dan0|FY(t)FX(t)|Δ

H - A| F Y ( t ) - F X ( t ) | < Δ , setidaknya untuk satu t .A|FY(t)FX(t)|<Δt

Ini akan menerjemahkan ke spesifik dua satu sisi "negativist" nol hipotesis untuk menguji untuk kesetaraan (dua hipotesis ini mengambil bentuk yang sama, karena kedua D + dan D - secara ketat non-negatif):D+D

H - 01D +Δ , atau01D+Δ

H - 02D -Δ .02DΔ

Menolak kedua H - 01 dan H - 02 akan membawa kita untuk menyimpulkan bahwa - Δ < F Y ( t ) - F X ( t ) < Δ . Tentu saja, interval ekivalensi tidak perlu simetris, dan - Δ dan Δ dapat diganti dengan Δ 2 (lebih rendah) dan Δ 1 (atas) untuk masing-masing hipotesis nol satu sisi.01 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

Statistik Uji (Diperbarui: Delta berada di luar tanda nilai absolut)
Statistik uji D + 1 dan D - 2 (meninggalkan n Y dan n X tersirat) masing-masing sesuai dengan H - 01 dan H - 02 , dan adalah:D+1D2nYnX0102

D+1=ΔD+=Δ|maxt[(FY(t)FX(t))]|D+1=ΔD+=Δ|maxt[(FY(t)FX(t))]|, and

D2=ΔD=Δ|mint[(FY(t)FX(t))]|D2=ΔD=Δ|mint[(FY(t)FX(t))]|

The Equivalence / Relevance Threshold
Interval [ - Δ , Δ ] —atau [ Δ 2 , Δ 1 ] , jika menggunakan interval ekivalensi asimetris — dinyatakan dalam satuan D + dan D - , atau besarnya probabilitas yang dibedakan. Ketika n Y dan n X mendekati tak terhingga, CDF D + atau D - untuk n Y , n X mendekati 0 untuk t[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0<0t<0, and for t0t0:

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF of $D^{+}$ (or $D^{-}$)

So it seems to me that the PDF for sample size-scaled D+D+ (or sample size-scaled DD) must be 00 for t<0t<0, and for t0t0:

f(t)=1e2t2ddt=4te2t2

f(t)=1e2t2ddt=4te2t2

PDF of $D^{+}$ (or $D^{-}$)

Glen_b points out that this is a Rayleigh distribution with σ=12σ=12. So the large sample quantile function for sample size-scaled D+D+ and DD is:

CDF1=Q(p)=ln(1p)2

CDF1=Q(p)=ln(1p)2

and a liberal choice of ΔΔ might be the critical value Qα+σ/2=Qα+14Qα+σ/2=Qα+14, and a more strict choice the critical value Qα+σ/4=Qα+18Qα+σ/4=Qα+18.

Alexis
sumber
1
In the line where you pass from the cdf to the pdf, I think you got that wrong. Let KnY,nX=nYnXnY+nXD+KnY,nX=nYnXnY+nXD+, so (abusing notation), in the limit P(K,t)=1e2t2P(K,t)=1e2t2. Then fK(t)=ddt1e2t2=4te2t2fK(t)=ddt1e2t2=4te2t2 (note the tt after the 44). (note also a missing sign in the exponent in the line above the taking of the derivative. Also I'm not sure why you have an integral symbol there, but maybe I misunderstood something.)
Glen_b -Reinstate Monica
2
@stochazesthai D1D1 and D2D2 are two one-sided test statistics. Per TOST you need to reject both the null hypotheses to which these test statistics apply. QαQα is a critical value from CDF11 on the above line, and where you want to sub in 1α1α for pp (e.g. Qα=ln(1(1α))2Qα=ln(1(1α))2). The choice of ΔΔ depends on how far past QαQα (the critical rejection value for a plain old positivist H0H0) you need to go, before you conclude relevant difference (e.g. liberal 'equivalence' is 1414 σσ beyond QαQα).
Alexis
2
@stochazesthai (Continuing) So if both D1ΔD1Δ and D2ΔD2Δ, then you reject H0H0.
Alexis
2
@stochazesthai Whoops! I should have put the quotes around the word liberal rather than equivalence two comments back. :)
Alexis
2
@stochazesthai If D1ΔD1Δ, then reject H01H01, if D1<ΔD1<Δ, then fail to reject H01H01. If D2ΔD2Δ, then reject H02H02, if D2<ΔD2<Δ, then fail to reject H02H02. If reject both H01H01 and H02H02, then reject H0H0, otherwise fail to reject H0H0.
Alexis
6

An alternative to TOST in equivalence testing is based on the confidence interval approach:

Let ΔΔ denote the prespecified equivalence margin and
θ:=supt|FX(t)FY(t)|

θ:=supt|FX(t)FY(t)|
the Kolmogorov-Smirnov distance between the unknown underlying distribution functions.

Now, if a 90% confidence interval for θθ is completely within [Δ,Δ][Δ,Δ], then we may be 95% certain that θθ is enough close to 0 to speak of "equivalence".

Without knowing the underlying distributions, it seems to be hopeless to derive an approximate analytic confidence interval, so we might need to rely on (bias corrected) bootstrap confidence intervals based on resampling from pairs XX and Y. (I don't want to find conditions for their validity in this particular application though...)

Michael M
sumber
Excellent. Do you have a citation for anyone undertaking the CI of Dn1,n2 (bootstrap or otherwise)?
Alexis
1
Good point... The short paper tomswebpage.net/images/K-S_test.doc mentions the "Handbook of Parametric and Nonparametric Statistical Procedures, Fifth Edition by David J.Sheskin (Apr 27, 2011)." to offer a two-sample case construcion for D. But at the moment, I don't have access to this book.
Michael M