Kutipan berikut berasal dari entri, Apa perbedaan antara tes satu-ekor dan dua-ekor? , di situs bantuan statistik UCLA.
... pertimbangkan konsekuensi dari kehilangan efek ke arah lain. Bayangkan Anda telah mengembangkan obat baru yang Anda yakini merupakan peningkatan dibandingkan obat yang sudah ada. Anda ingin memaksimalkan kemampuan Anda untuk mendeteksi peningkatan, sehingga Anda memilih untuk tes satu sisi. Dengan melakukannya, Anda gagal menguji kemungkinan bahwa obat baru kurang efektif daripada obat yang ada.
Setelah mempelajari dasar-dasar absolut pengujian hipotesis dan sampai pada bagian tentang satu vs dua tes berekor ... Saya memahami matematika dasar dan meningkatkan kemampuan deteksi satu tes berekor, dll ... Tapi saya tidak bisa membungkus kepala saya sekitar satu hal ... Apa gunanya? Saya benar-benar gagal memahami mengapa Anda harus membagi alfa Anda di antara dua ekstrem ketika hasil sampel Anda hanya dapat berada di satu atau yang lain, atau tidak sama sekali.
Ambil contoh skenario dari teks yang dikutip di atas. Bagaimana mungkin Anda "gagal menguji" untuk hasil yang berlawanan arah? Anda memiliki mean sampel Anda. Anda memiliki populasi rata-rata. Aritmatika sederhana memberi tahu Anda mana yang lebih tinggi. Apa yang ada untuk menguji, atau gagal untuk menguji, di arah yang berlawanan? Apa yang menghentikan Anda hanya mulai dari awal dengan hipotesis yang berlawanan jika Anda melihat dengan jelas bahwa mean sampel jauh ke arah lain?
Kutipan lain dari halaman yang sama:
Memilih uji satu sisi setelah menjalankan uji dua sisi yang gagal menolak hipotesis nol tidak tepat, tidak peduli seberapa "dekat" dengan signifikansi uji dua sisi itu.
Saya berasumsi ini juga berlaku untuk mengganti polaritas pengujian satu sisi Anda. Tetapi bagaimana hasil "perawatan" ini kurang valid daripada jika Anda hanya memilih tes satu-ekor yang benar di tempat pertama?
Jelas saya kehilangan sebagian besar gambar di sini. Semuanya sepertinya terlalu sewenang-wenang. Yang mana, saya kira, dalam arti bahwa apa yang menandakan "signifikan secara statistik" - 95%, 99%, 99,9% ... Mulai sewenang-wenang.
Jawaban:
Pikirkan data sebagai puncak gunung es - yang dapat Anda lihat di atas air adalah puncak gunung es, tetapi pada kenyataannya Anda tertarik untuk mempelajari sesuatu tentang seluruh gunung es.
Para ahli statistik, ilmuwan data, dan lainnya yang bekerja dengan data berhati-hati untuk tidak membiarkan apa yang mereka lihat di atas garis air mempengaruhi dan membiaskan penilaian mereka terhadap apa yang tersembunyi di bawah garis air. Untuk alasan ini, dalam situasi pengujian hipotesis, mereka cenderung untuk merumuskan hipotesis nol dan alternatif sebelum mereka melihat puncak gunung es, berdasarkan pada harapan mereka (atau tidak adanya) tentang apa yang mungkin terjadi jika mereka dapat melihat gunung es secara keseluruhan. .
Melihat data untuk merumuskan hipotesis Anda adalah praktik yang buruk dan harus dihindari - itu seperti meletakkan kereta di depan kuda. Ingat bahwa data berasal dari sampel tunggal yang dipilih (mudah-mudahan menggunakan mekanisme seleksi acak) dari populasi target / semesta yang diminati. Sampel memiliki kekhasan sendiri, yang mungkin atau mungkin tidak mencerminkan populasi yang mendasarinya. Mengapa Anda ingin hipotesis Anda mencerminkan potongan populasi yang sempit daripada seluruh populasi?
Cara lain untuk memikirkan hal ini adalah bahwa, setiap kali Anda memilih sampel dari populasi target Anda (menggunakan mekanisme seleksi acak), sampel akan menghasilkan data yang berbeda. Jika Anda menggunakan data (yang seharusnya tidak !!!) untuk memandu spesifikasi hipotesis nol dan alternatif Anda, hipotesis Anda akan ada di seluruh peta, pada dasarnya didorong oleh fitur istimewa dari masing-masing sampel. Tentu saja, dalam praktiknya kami hanya menggambar satu sampel, tetapi itu akan menjadi pemikiran yang sangat membingungkan untuk mengetahui bahwa jika orang lain melakukan penelitian yang sama dengan sampel yang berbeda dengan ukuran yang sama, mereka harus mengubah hipotesis mereka untuk mencerminkan kenyataan dari sampel mereka.
Salah satu profesor sekolah pascasarjana saya dulunya memiliki ungkapan yang sangat bijak: "Kami tidak peduli dengan sampel, kecuali bahwa itu memberi tahu kami sesuatu tentang populasi" . Kami ingin merumuskan hipotesis kami untuk mempelajari sesuatu tentang populasi target, bukan tentang satu sampel yang kami pilih dari populasi itu.
sumber
Saya pikir ketika mempertimbangkan pertanyaan Anda, ada baiknya jika Anda mencoba mengingat tujuan / nilai jual dari pengujian signifikansi nol-hipotesis (NHST) dalam pikiran; itu hanya satu paradigma (meskipun yang sangat populer) untuk inferensi statistik, dan yang lain memiliki kekuatan mereka sendiri (misalnya, lihat di sini untuk diskusi tentang NHST relatif terhadap inferensi Bayesian). Apa manfaat besar dari NHST ?: Kontrol kesalahan jangka panjang . Jika Anda mengikuti aturan NHST (dan terkadang itu sangat besar jika), maka Anda harus memiliki pemahaman yang baik tentang seberapa besar kemungkinan Anda salah dengan kesimpulan yang Anda buat, dalam jangka panjang.
Salah satu aturan persisten NHST adalah bahwa, tanpa perubahan lebih lanjut pada prosedur pengujian Anda, Anda hanya dapat melihat satu kali pengujian yang Anda minati. Para peneliti dalam praktek sering mengabaikan (atau tidak sadar) aturan ini (lihat Simmons et al., 2012), melakukan beberapa tes setelah menambahkan gelombang data, memeriksa merekap -nilai setelah menambahkan / menghapus variabel ke model mereka, dll. Masalahnya adalah bahwa peneliti jarang netral sehubungan dengan hasil NHST; mereka sangat menyadari bahwa hasil yang signifikan lebih mungkin untuk dipublikasikan daripada hasil yang tidak signifikan (untuk alasan yang keduanya salah arah dan sah; Rosenthal, 1979). Oleh karena itu peneliti sering termotivasi untuk menambahkan data / mengubah model / memilih outlier dan berulang kali menguji sampai mereka "mengungkap" efek yang signifikan (lihat John et al., 2011, pengantar yang baik).
Masalah berlawanan diciptakan oleh praktik di atas, dijelaskan dengan baik dalam Dienes (2008): jika peneliti akan terus menyesuaikan sampel / desain / model mereka sampai signifikansi tercapai, maka tingkat kesalahan jangka panjang yang diinginkan dari temuan positif palsu (sering ) dan temuan false-negative (sering ) masing-masing akan mendekati 1.0 dan 0.0, masing-masing (yaitu, Anda akan selalu menolak , baik ketika itu salah maupun ketika itu benar).α=.05 β=.20 H0
Dalam konteks pertanyaan spesifik Anda, peneliti menggunakan tes dua sisi sebagai default ketika mereka tidak ingin membuat prediksi tertentu sehubungan dengan arah efeknya. Jika mereka salah dalam menebak mereka, dan menjalankan tes satu arah ke arah efek, jangka panjang mereka akan meningkat. Jika mereka melihat statistik deskriptif dan menjalankan uji satu sisi berdasarkan pengamatan mereka tentang tren, jangka panjang akan meningkat. Anda mungkin berpikir ini bukan masalah besar, dalam prakteknya, bahwa nilai- kehilangan arti jangka panjangnya, tetapi jika mereka tidak mempertahankan artinya, itu menimbulkan pertanyaan mengapa Anda menggunakan pendekatan untuk menyimpulkan bahwa memprioritaskan kontrol kesalahan jangka panjang.α pα α p
Terakhir (dan sebagai pilihan pribadi), saya akan memiliki lebih sedikit masalah jika Anda pertama kali melakukan tes dua sisi, menemukan itu tidak signifikan, kemudian melakukan tes satu arah ke arah tes pertama tersirat, dan menemukan itu signifikan jika (dan hanya jika) Anda melakukan replikasi konfirmasi yang ketat dari efek itu dalam sampel lain, dan menerbitkan replikasi dalam kertas yang sama. Analisis data eksplorasi - dengan praktik analisis fleksibel tingkat kesalahan yang berkembang - baik-baik saja, selama Anda dapat mereplikasi efek Anda dalam sampel baru tanpa fleksibilitas analitik yang sama.
Referensi
Dienes, Z. (2008). Memahami psikologi sebagai ilmu: Pengantar inferensi ilmiah dan statistik . Palgrave Macmillan.
John, LK, Loewenstein, G., & Prelec, D. (2012). Mengukur prevalensi praktik penelitian yang dipertanyakan dengan insentif untuk pengungkapan kebenaran. Ilmu psikologi , 23 (5), 524-532.
Rosenthal, R. (1979). Masalah laci file dan toleransi untuk hasil nol. Buletin psikologis , 86 (3), 638.
Simmons, JP, Nelson, LD, & Simonsohn, U. (2011). Psikologi positif-palsu: Fleksibilitas yang tidak diungkapkan dalam pengumpulan dan analisis data memungkinkan penyajian yang penting. Ilmu psikologi , 22 (11), 1359-1366.
sumber
Sayangnya, contoh pengembangan obat yang memotivasi bukanlah yang baik karena bukan apa yang kita lakukan untuk mengembangkan obat. Kami menggunakan aturan yang berbeda dan lebih ketat untuk menghentikan studi jika tren berada di pihak yang membahayakan. Ini untuk keselamatan pasien dan juga karena obat tersebut tidak mungkin secara ajaib berayun ke arah manfaat yang bermakna.
Jadi mengapa dua tes berekor ? (ketika dalam kebanyakan kasus kami memiliki beberapa gagasan apriori tentang kemungkinan arah efek yang kami coba modelkan)
Hipotesis nol harus menanggung beberapa kemiripan dengan keyakinan dalam arti yang masuk akal, informasi, dan dibenarkan. Dalam kebanyakan kasus, orang setuju "hasil yang tidak menarik" adalah ketika ada 0 efek, sedangkan efek negatif atau positif sama menarik. Sangat sulit untuk mengartikulasikan hipotesis nol komposit, misalnya kasus di mana kita tahu statistiknya bisa sama dengan ataukurang dari jumlah tertentu. Seseorang harus sangat eksplisit tentang hipotesis nol untuk memahami temuan ilmiah mereka. Perlu ditunjukkan bahwa cara seseorang melakukan uji hipotesis gabungan adalah bahwa statistik di bawah hipotesis nol mengasumsikan nilai paling konsisten dalam rentang data yang diamati. Jadi jika efeknya berada dalam arah positif seperti yang diharapkan, nilai nol dianggap 0, dan kami telah memperdebatkan hal yang tidak perlu.
Dua tes berekor sama dengan melakukan dua tes satu sisi dengan kontrol untuk beberapa perbandingan! Tes dua sisi sebenarnya sebagian dihargai karena akhirnya menjadi lebih konservatif dalam jangka panjang. Ketika kita memiliki keyakinan yang baik tentang arah efek, dua tes berekor akan menghasilkan setengah positif palsu sesering dengan keseluruhan efek yang sangat kecil pada daya.
Dalam hal mengevaluasi perawatan dalam uji coba terkontrol secara acak, jika Anda mencoba menjual tes satu sisi kepada saya, saya akan menghentikan Anda untuk bertanya, "Baiklah tunggu, mengapa kita percaya bahwa perawatan itu sebenarnya berbahaya? Apakah sebenarnya ada bukti untuk mendukung ini? Apakah bahkan ada Equoise [kemampuan untuk menunjukkan efek yang menguntungkan]? " Ketidakkonsistenan logis di balik tes satu sisi membuat seluruh penelitian dipertanyakan. Jika benar-benar tidak ada yang diketahui, nilai selain 0 dianggap menarik dan tes dua sisi bukan hanya ide yang bagus, itu perlu.
sumber
Salah satu cara untuk mendekati itu adalah untuk sementara waktu melupakan pengujian hipotesis dan berpikir tentang interval kepercayaan sebagai gantinya. Tes satu sisi sesuai dengan interval kepercayaan satu sisi dan tes dua sisi sesuai dengan interval kepercayaan dua sisi.
Misalkan Anda ingin memperkirakan rata-rata populasi. Secara alami, Anda mengambil sampel dan menghitung rata-rata sampel. Tidak ada alasan untuk mengambil estimasi titik pada nilai nominal, jadi Anda mengekspresikan jawaban Anda dalam interval yang cukup Anda yakini mengandung mean sebenarnya. Apa jenis interval yang Anda pilih? Interval dua sisi sejauh ini merupakan pilihan yang lebih alami. Interval satu sisi hanya masuk akal ketika Anda tidak peduli untuk menemukan batas atas atau batas bawah perkiraan Anda (karena Anda percaya bahwa Anda sudah tahu batas yang berguna dalam satu arah). Seberapa sering Anda benar - benar yakin tentang situasi ini?
Mungkin mengalihkan pertanyaan ke interval kepercayaan tidak benar-benar berhasil, tetapi secara metodologis tidak konsisten untuk memilih tes satu sisi tetapi interval kepercayaan dua sisi.
sumber
Masalahnya adalah Anda tidak tahu maksud populasi. Saya tidak pernah mengalami skenario dunia nyata yang saya tahu populasi sebenarnya berarti.
Saya membaca paragraf Anda beberapa kali, tetapi saya masih tidak yakin dengan argumen Anda. Apakah Anda ingin mengulanginya? Anda gagal "menguji" jika data Anda tidak mendarat di wilayah kritis yang Anda pilih.
Kutipan ini benar karena meretas nilai-p tidak pantas. Berapa banyak yang kita ketahui tentang peretasan "di alam liar"? memiliki detail lebih lanjut.
Itu sewenang-wenang. Itu sebabnya para ilmuwan data umumnya melaporkan besarnya nilai-p itu sendiri (tidak hanya signifikan atau tidak signifikan), dan juga ukuran efek.
sumber
Semua perbedaan bergantung pada pertanyaan yang ingin Anda jawab. Jika pertanyaannya adalah: "Apakah satu kelompok nilai lebih besar dari yang lain?" Anda dapat menggunakan tes satu sisi. Untuk menjawab pertanyaan: "Apakah kelompok nilai ini berbeda?" Anda menggunakan tes dua sisi. Mempertimbangkan bahwa satu set data mungkin secara statistik lebih tinggi dari yang lain, tetapi tidak berbeda secara statistik ... dan itu statistik.
sumber
Nilai alpha adalah probabilitas bahwa Anda akan menolak nol, mengingat nol itu benar. Misalkan nol Anda adalah rata-rata sampel terdistribusi normal dengan rata-rata nol. Jika P (mean sampel> 1 | H0) = .05, maka aturan "Kumpulkan sampel, dan tolak nol jika rata-rata sampel lebih besar dari 1" memiliki probabilitas, mengingat bahwa nol itu benar, dari 5% dari menolak nol. Aturan "Kumpulkan sampel, dan jika rata-rata sampel positif, maka tolak nol jika rata-rata sampel lebih besar dari 1, dan jika rata-rata sampel negatif, tolak nol jika rata-rata sampel kurang dari 1" memiliki probabilitas, mengingat bahwa nol itu benar, dari 10% menolak nol. Jadi aturan pertama memiliki alpha 5%, dan aturan kedua memiliki alpha 10%. Jika Anda memulai dengan tes dua sisi, dan kemudian mengubahnya menjadi tes satu sisi berdasarkan data, maka Anda mengikuti aturan kedua, sehingga tidak akurat untuk melaporkan alfa Anda sebesar 5%. Nilai alfa tidak hanya tergantung pada data apa, tetapi aturan apa yang Anda ikuti dalam menganalisisnya. Jika Anda bertanya mengapa menggunakan metrik yang memiliki properti ini, alih-alih sesuatu yang hanya bergantung pada data, itu adalah pertanyaan yang lebih rumit.
sumber
Mengenai poin ke-2
kami memiliki itu, jika nol benar, yang pertama, uji dua sisi, palsu menolak dengan probabilitas , tetapi satu sisi juga dapat menolak di tahap kedua.α
Oleh karena itu, kemungkinan penolakan keseluruhan akan melebihi , dan Anda tidak menguji pada tingkat yang Anda yakini akan diuji lagi - Anda lebih sering mendapatkan penolakan palsu daripada di dari kasus di mana strategi diterapkan untuk hipotesis nol sejati.α α⋅100%
Secara keseluruhan, kami mencari yang dapat kita nyatakan sebagai Kedua peristiwa dalam serikat terpisah, sehingga kita mengejar Untuk istilah kedua, ada massa probabilitas antara kuantil dan (yaitu, titik penolakan dari tes satu sisi dan dua sisi), yang merupakan probabilitas gabungan dari tes dua sisi tidak menolak tetapi satu sisi melakukannya. Karenanya,
Ini adalah ilustrasi numerik kecil:
sumber
Ini hanyalah satu cara sewenang-wenang untuk melihatnya: Untuk apa tes statistik digunakan? Mungkin alasan paling sering untuk melakukan tes adalah karena Anda ingin meyakinkan orang (yaitu editor, pengulas, pembaca, audiens) bahwa hasil Anda "cukup jauh acak" untuk diperhatikan. Dan entah bagaimana kami menyimpulkan bahwa adalah kebenaran yang arbitrer, namun universal.p<α=0.05
Untuk alasan yang masuk akal lain untuk melakukan tes, Anda tidak akan pernah puas dengan tetap dari , tetapi Anda akan bervariasi Anda dari kasus ke kasus, tergantung pada betapa pentingnya konsekuensi yang, bahwa Anda menarik dari tes.α 0.05 α
Kembali ke meyakinkan orang, bahwa ada sesuatu yang "cukup jauh dari sekadar acak" untuk memenuhi kriteria universal tentang kepedulian. Kami memiliki kriteria yang masuk akal, namun diterima secara universal, yang kami yakini dianggap "tidak acak" pada untuk pengujian dua sisiα=0.05 . Kriteria yang setara adalah dengan melihat data, memutuskan cara mana untuk menguji dan menggambar garis pada . Yang kedua setara dengan yang pertama, tetapi bukan itu yang secara historis kita setujui.α=0.025
Setelah Anda mulai melakukan tes satu sisi dengan Anda membuat diri Anda curiga terhadap perilaku yang tidak semestinya, memancing signifikansi. Jangan lakukan itu, jika Anda ingin meyakinkan orang!α=0.05
Lalu, tentu saja, ada hal yang disebut peneliti derajat kebebasan . Anda dapat menemukan signifikansi dalam jenis data apa pun, jika Anda memiliki data yang cukup dan bebas untuk mengujinya dalam berbagai cara yang Anda inginkan. Inilah sebabnya mengapa Anda harus memutuskan tes yang Anda lakukan sebelum melihat data. Segala sesuatu yang lain mengarah pada hasil tes yang tidak dapat diproduksi kembali. Saya menyarankan untuk pergi ke youtube dan melihat Andrew Gelmans bicara "Kejahatan pada data untuk lebih lanjut tentang itu.
sumber
Pada pandangan pertama, tidak satu pun dari pernyataan ini yang membuat pernyataan bahwa tes dua sisi lebih unggul daripada penelitian satu sisi. Hanya perlu ada hubungan logis dari hipotesis penelitian yang diuji terkait dengan kesimpulan statistik yang diuji.
Misalnya:
Pertama-tama ini adalah studi narkoba. Jadi menjadi salah dalam arah yang berlawanan memiliki signifikansi sosial di luar kerangka kerja statistik. Jadi seperti banyak yang mengatakan kesehatan bukanlah yang terbaik untuk membuat generalisasi.
Dalam kutipan di atas, tampaknya tentang pengujian obat ketika yang lain sudah ada. Jadi bagi saya, ini berarti obat Anda dianggap sudah efektif. Pernyataan tersebut berkenaan dengan perbandingan dua obat yang efektif setelahnya. Ketika membandingkan distribusi ini jika Anda mengabaikan satu sisi populasi demi meningkatkan hasil komparatifnya? Ini bukan hanya kesimpulan yang bias tetapi perbandingannya tidak lagi valid untuk dibenarkan: Anda membandingkan apel dengan jeruk.
Demikian pula, mungkin ada perkiraan poin bahwa demi kesimpulan statistik tidak membuat perbedaan pada kesimpulan, tetapi sangat penting secara sosial. Itu karena sampel kami mewakili kehidupan orang: sesuatu yang tidak dapat "terjadi kembali" dan tidak ternilai.
Atau, pernyataan itu menyiratkan bahwa peneliti memiliki insentif: "Anda ingin memaksimalkan kemampuan Anda untuk mendeteksi peningkatan ..." Gagasan ini tidak sepele untuk kasus yang diisolasi sebagai protokol yang buruk.
Sekali lagi di sini ini menyiratkan bahwa peneliti sedang 'mengalihkan' pengujiannya: dari dua sisi ke satu sisi. Ini tidak pernah tepat. Sangat penting untuk memiliki tujuan penelitian sebelum pengujian. Dengan selalu default pada kenyamanan dari pendekatan dua sisi - para peneliti dengan mudah gagal untuk lebih memahami fenomena tersebut.
Inilah makalah tentang topik ini, pada kenyataannya, membuat kasus bahwa tes dua sisi telah digunakan secara berlebihan.
Ini menyalahkan penggunaan yang berlebihan dari tes dua sisi pada kurangnya:
Dibutuhkan posisi dan sikap yang peneliti:
https://www.sciencedirect.com/science/article/pii/S0148296312000550
sumber
Seringkali tes signifikansi dilakukan untuk hipotesis nol terhadap hipotesis alternatif . Ini adalah ketika satu-ekor versus dua-ekor membuat perbedaan.
Untuk nilai-p ini (dua atau satu sisi) tidak masalah! Intinya adalah bahwa Anda memilih criterium yang hanya terjadi sebagian kecil dari waktu ketika hipotesis nol benar. Ini adalah dua bagian kecil dari kedua ekor, atau satu bagian besar dari satu ekor, atau yang lainnya.α
Tingkat kesalahan tipe I tidak berbeda untuk satu atau dua tes sisi.
Di sisi lain, untuk kekuatan itu penting .
Jika hipotesis alternatif Anda asimetris, maka Anda ingin memfokuskan kriteria untuk menolak hipotesis nol hanya pada ekor / akhir ini; sehingga ketika hipotesis alternatif itu benar maka Anda cenderung untuk tidak menolak ("menerima") hipotesis nol.
Jika hipotesis alternatif Anda simetris (Anda tidak peduli untuk menempatkan kekuatan lebih atau kurang di satu sisi tertentu), dan defleksi / efek di kedua sisi sama-sama diharapkan (atau hanya tidak diketahui / tidak diinformasikan), maka lebih kuat untuk menggunakan uji dua sisi (Anda tidak kehilangan daya 50% untuk ekor yang tidak Anda uji dan di mana Anda akan membuat banyak kesalahan tipe II).
Tingkat kesalahan tipe II berbeda untuk tes satu dan dua sisi dan tergantung pada hipotesis alternatif juga.
Itu menjadi lebih mirip konsep Bayesian sekarang ketika kita mulai melibatkan prasangka tentang apakah kita mengharapkan efek jatuh di satu sisi atau di kedua sisi, dan ketika kita ingin menggunakan tes (untuk melihat apakah kita dapat memalsukan suatu null-hipotesis) untuk 'mengkonfirmasi' atau membuat sesuatu yang lebih mungkin seperti efek.
sumber
Jadi satu lagi usaha menjawab:
Saya kira apakah mengambil satu-ekor atau dua-ekor tergantung sepenuhnya pada hipotesis Alternatif .
Pertimbangkan contoh rata-rata pengujian berikut dalam uji-t:
Sekarang jika Anda mengamati mean sampel yang sangat negatif atau mean sampel yang sangat positif, hipotesis Anda tidak mungkin benar.
Di sisi lain, Anda akan bersedia menerima hipotesis Anda jika rerata sampel Anda mendekati baik negatif atau positif . Sekarang Anda harus memilih interval di mana, jika mean sampel Anda akan jatuh, Anda tidak akan menolak hipotesis nol Anda. Jelas Anda akan memilih interval yang memiliki sisi negatif dan positif sekitar . Jadi Anda memilih tes dua sisi.0 0
Tetapi bagaimana jika Anda tidak ingin menguji , melainkan . Sekarang secara intuitif apa yang ingin kita lakukan di sini adalah jika nilai rata-rata sampel menjadi sangat negatif, maka kita pasti dapat menolak nol kita. Jadi kami ingin menolak nol hanya untuk nilai negatif jauh dari rata-rata sampel.μ=0 μ≥0
Tapi tunggu! Jika itu hipotesis nol saya, bagaimana saya mengatur distribusi nol saya. Distribusi nol dari mean sampel diketahui untuk beberapa nilai yang diasumsikan dari parameter populasi (di sini ). Tetapi di bawah null saat ini dapat mengambil banyak nilai.0
Katakanlah kita dapat melakukan hipotesis nol tanpa batas. Masing-masing untuk mengasumsikan nilai positif . Tapi pikirkan ini: Dalam hipotesis pertama kami dari , jika kita hanya menolak nol pada pengelompokan mean sampel negatif yang sangat jauh, maka setiap hipotesis berikutnya dengan juga akan menolaknya. Karena bagi mereka, mean sampel bahkan lebih jauh dari parameter populasi. Jadi pada dasarnya yang perlu kita lakukan adalah hanya melakukan satu hipotesis tetapi satu arah .μ H0:μ=0 H0:μ>0
Jadi solusi Anda menjadi:
Contoh terbaik adalah tes Dickey-Fuller untuk stasioneritas.
Semoga ini membantu. (Ingin memasukkan diagram tetapi membalas dari seluler).
sumber