Hitung nilai-p dalam bootstrap berpasangan

8

Saya menemukan kertas baru dari kelompok Berkeley NLP tentang pengujian statistik, Investigasi Empiris Signifikansi Statistik di NLP .

Ada pseudocode untuk menghitung nilai-p dalam makalah, pada dasarnya, idenya adalah bahwa set sampel disampel dengan penggantian dari data . Kemudianx1,x2,...,xNx

p-value=count(δ(xi)>2δ(x))/N , di mana adalah gain metrik.δ(xi)

Saya bisa memahami rumus untuk menghitung nilai-p dalam makalah Koehn, uji signifikansi statistik untuk evaluasi terjemahan mesin , di mana:

p-value=count(δa(xi)<δb(xi))/N , di mana dan adalah gain metrik untuk sistem dan masing-masing.δaδbab

Apakah ada penjelasan atau referensi untuk formula . Para penulis juga mencatat bahwa jika rata-rata adalah dan simetris, maka kedua rumus di atas sama.p-value=count(δ(xi)>2δ(x))/Nδ(xsaya)δ(x)δ(xsaya)

Ke Tran
sumber

Jawaban:

1

Sejauh yang saya mengerti dari melihat bagian 2, penulis tampaknya menjelaskan alasan mereka untuk tes bootstrap sebagai berikut-

"itu xsaya disampel dari x, dan rata-rata mereka δ(xi)tidak akan nol seperti tuntutan hipotesis nol; rata-rata sebaliknya akan adaδ(x)... Solusinya adalah memusatkan kembali mean - kami ingin tahu seberapa sering SEBUAH tidak lebih dari δ(x)lebih baik dari yang diharapkan. Kami berharap bisa mengalahkannyaB oleh δ(x). Karena itu, kami menghitung berapaxsaya memiliki SEBUAH mengalahkan B setidaknya δ(x). "

Penulis ingin menguji apakah keuntungannya bukan nol sehingga mereka menuliskan nilai-p sebagai δ(xsaya)<2δ(x) , yang dapat ditulis ulang sebagai 0<2δ(x)-δ(xsaya); karenaE[δ(xsaya)]=δ(x) RHS dari ketimpangan kemudian menjadi δ(x), yang merupakan H0 mereka berusaha menolak.

Sameer
sumber