T-test yang kuat untuk mean

17

Saya mencoba untuk menguji null , terhadap alternatif lokal E [ X ] > 0 , untuk variabel acak X , tunduk pada kemiringan ringan hingga sedang dan kurtosis dari variabel acak. Mengikuti saran oleh Wilcox dalam 'Pengantar Estimasi Kuat dan Pengujian Hipotesis', saya telah melihat tes berdasarkan rata-rata yang dipangkas, median, serta penduga lokasi M (prosedur "satu langkah" Wilcox). Tes yang kuat ini mengungguli uji-t standar, dalam hal kekuatan, ketika menguji dengan distribusi yang tidak miring, tetapi leptokurtotik.E[X]=0E[X]>0X

Namun, ketika pengujian dengan distribusi yang condong, tes satu sisi ini terlalu liberal atau terlalu konservatif di bawah hipotesis nol, tergantung pada apakah distribusinya yang condong ke kiri atau kanan, masing-masing. Misalnya, dengan 1000 pengamatan, tes berdasarkan median sebenarnya akan menolak ~ 40% dari waktu, pada tingkat nominal 5%. Alasannya jelas: untuk distribusi miring, median dan rerata agak berbeda. Namun, dalam aplikasi saya, saya benar-benar perlu menguji mean, bukan median, bukan mean dipangkas.

Apakah ada versi yang lebih kuat dari uji-t yang benar-benar menguji mean, tetapi tahan terhadap kemiringan dan kurtosis?

Idealnya prosedur ini akan bekerja dengan baik dalam kasus tanpa-condong, kurtosis tinggi juga. Tes 'satu langkah' hampir cukup baik, dengan parameter 'tikungan' diatur relatif tinggi, tetapi tes ini kurang kuat daripada tes rata-rata yang dipangkas saat tidak ada kemiringan, dan memiliki beberapa masalah dalam mempertahankan tingkat nominal penolakan di bawah kemiringan. .

latar belakang: alasan saya benar-benar peduli tentang mean, dan bukan median, adalah bahwa tes akan digunakan dalam aplikasi keuangan. Misalnya, jika Anda ingin menguji apakah suatu portofolio memiliki pengembalian log yang diharapkan positif, rata-rata sebenarnya sesuai karena jika Anda berinvestasi dalam portofolio, Anda akan mengalami semua pengembalian (yang merupakan kali rata-rata jumlah sampel), daripada duplikat dari median. Artinya, saya benar-benar peduli tentang jumlah n menarik dari RV X .nnX

shabbychef
sumber
Apakah ada alasan yang melarang penggunaan uji-Welch? Lihat jawaban saya untuk pertanyaan ini ( stats.stackexchange.com/questions/305/… ) di mana saya merujuk pada makalah yang menganjurkan penggunaan Welch jika terjadi ketidaknormalan dan heteroskedastisitas.
Henrik
1
E[X]=μE[X1]=E[X2]
Terima kasih telah mengklarifikasi. Dalam hal ini kertas Kubinger tidak akan sangat membantu Anda. Saya menyesal.
Henrik

Jawaban:

5

Mengapa Anda melihat tes non-parametrik? Apakah asumsi uji-t dilanggar? Yakni, data ordinal atau non-normal dan varian tidak konstan? Tentu saja, jika sampel Anda cukup besar, Anda dapat membenarkan uji-t parametrik dengan kekuatannya yang lebih besar meskipun kurangnya normalitas dalam sampel. Demikian juga jika kekhawatiran Anda adalah varian yang tidak sama, ada koreksi pada uji parametrik yang menghasilkan nilai-p yang akurat (koreksi Welch).

Kalau tidak, membandingkan hasil Anda dengan uji-t bukanlah cara yang baik untuk melakukan hal ini, karena hasil uji-t bias ketika asumsi tidak terpenuhi. Mann-Whitney U adalah alternatif non-parametrik yang tepat, jika itu yang Anda butuhkan. Anda hanya kehilangan daya jika Anda menggunakan tes non-parametrik ketika Anda dapat menggunakan uji-t (karena asumsi-asumsi tersebut terpenuhi).

Dan, hanya untuk beberapa latar belakang, buka di sini ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM

Brett
sumber
data pasti tidak normal. kelebihan kurtosis ada di urutan 10-20, kemiringannya berada di urutan -0,2 hingga 0,2. Saya melakukan uji-1 sampel, jadi saya tidak yakin mengikuti Anda mengenai 'varian yang tidak sama', atau uji-U.
shabbychef
Saya menerima saran 'gunakan tes parametrik'. itu tidak benar-benar menyelesaikan pertanyaan saya, tetapi pertanyaan saya mungkin terlalu terbuka.
shabbychef
12

Saya setuju bahwa jika Anda ingin benar-benar menguji apakah rata-rata kelompok berbeda (dibandingkan dengan menguji perbedaan antara median kelompok atau rata-rata yang dipangkas, dll.), Maka Anda tidak ingin menggunakan tes nonparametrik yang menguji hipotesis yang berbeda.

  1. Secara umum nilai p dari uji-t cenderung cukup akurat mengingat keberangkatan moderat dari asumsi normalitas residual. Lihat applet ini untuk mendapatkan intuisi tentang ketahanan ini: http://onlinestatbook.com/stat_sim/robustness/index.html

  2. Jika Anda masih khawatir tentang pelanggaran asumsi normalitas, Anda mungkin ingin melakukan bootstrap . misalnya, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. Anda juga bisa mengubah variabel dependen miring untuk menyelesaikan masalah dengan penyimpangan dari normalitas.

Jeromy Anglim
sumber
2
+1 jawaban yang bagus dan jelas. Jeromy, dapatkah saya mengajukan pertanyaan tentang poin 3? Saya mengerti alasan di balik mengubah data, tetapi sesuatu selalu mengganggu saya tentang melakukan itu. Apa validitas melaporkan hasil uji-t pada data yang ditransformasikan ke data yang tidak diubah (di mana Anda tidak "diizinkan" melakukan uji-t)? Dengan kata lain, jika dua grup berbeda ketika data, misalnya, log ditransformasikan, atas dasar apa Anda dapat mengatakan bahwa data mentah juga berbeda? Ingat, saya bukan ahli statistik, jadi mungkin saya hanya mengatakan sesuatu yang benar-benar bodoh :)
nico
2
@nico Saya tidak yakin tentang cara melaporkan atau memikirkan hasil, tetapi jika semua yang ingin Anda tunjukkan adalah bahwa untuk beberapa X dan Y, mu_X! = mu_Y, harus benar bahwa untuk semua X_i <X_j, log ( X_i) <log (X_j) dan untuk semua semua X_i> X_j, log (X_i)> log (X_j). Itu sebabnya untuk tes non-parametrik yang beroperasi dengan peringkat, transformasi data tidak mempengaruhi hasilnya. Saya pikir dari ini, Anda dapat mengasumsikan bahwa jika beberapa tes menunjukkan bahwa mu_log (X)! = Mu_log (Y), maka mu_X! = Mu_Y.
JoFrhwld
terima kasih atas jawabannya. memang, uji-t tampaknya mempertahankan tingkat tipe I nominal di bawah input miring / kurtotik. Namun, saya mengharapkan sesuatu dengan kekuatan lebih. re: 2, saya telah mengimplementasikan Wilcox ' trimpbdan trimcibt, tetapi mereka agak terlalu lambat untuk melakukan tes kekuatan saya, setidaknya untuk selera saya. re: 3, saya telah memikirkan metode ini, tetapi saya tertarik pada rata-rata dari data yang tidak ditransformasi (yaitu, saya tidak membandingkan 2 RVs dengan uji-t, dalam hal ini, transformasi monoton akan baik-baik saja untuk perbandingan berdasarkan peringkat, seperti dicatat oleh @JoFrhwld.)
shabbychef
2
@nico Jika distribusi populasi residu adalah sama dalam dua kelompok, maka saya membayangkan setiap kali ada perbedaan dalam kelompok populasi mentah berarti akan ada juga perbedaan dalam kelompok cara transformasi pelestarian pesanan. Yang mengatakan, nilai-p dan interval kepercayaan akan cenderung berubah sedikit berdasarkan pada apakah Anda menggunakan data mentah atau data yang diubah. Secara umum saya lebih suka menggunakan transformasi ketika mereka tampak seperti metrik yang bermakna untuk memahami variabel (misalnya, skala Richter, desibel, log penghitungan, dll.).
Jeromy Anglim
3

t -statistic dan keyakinan interval yang merupakan titik yang baik awal untuk masalah saya. Koreksi didasarkan pada ekspansi Cornish-Fisher, dan menggunakan kemiringan sampel.

Yang 'terbaru dan terhebat' adalah karena Ogaswara , dengan referensi di dalamnya untuk Hall dan lainnya.

shabbychef
sumber
0

Saya tidak memiliki reputasi yang cukup untuk berkomentar, dengan demikian sebagai jawaban: Lihatlah penghitungan ini . Saya pikir ini memberikan jawaban yang bagus. Secara singkat:

Kinerja asimptotik jauh lebih sensitif terhadap penyimpangan dari normalitas dalam bentuk skewness daripada dalam bentuk kurtosis ... Dengan demikian uji-t Student sensitif terhadap skewness tetapi relatif kuat terhadap ekor yang berat, dan masuk akal untuk menggunakan tes untuk normalitas yang diarahkan pada alternatif miring sebelum menerapkan uji-t.

Christoph
sumber