Ketika n meningkatkan nilai-t meningkat dalam uji hipotesis, tetapi t-tabel justru sebaliknya. Mengapa?

Rumus untuk dalam uji hipotesis diberikan oleh: $t$

t = \frac{\bar{X} - μ}{\hat{σ} / \sqrt{n}} .

$t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}.$

Ketika meningkat, nilai- meningkat sesuai dengan rumus di atas. Tetapi mengapa kritis menurun pada -tabel saat (yang merupakan fungsi dari ) meningkat? $n$ $t$ $t$ $t$ $\text{df}$ $n$

hypothesis-testing self-study statistical-significance t-test t-distribution raksasa
sumber

Jawaban:

Ini adalah dua fenomena yang berbeda:

$t$ -statistik

Memegang semua yang lain konstan, jika meningkatkan nilai- harus meningkat sebagai masalah aritmatika sederhana. Pertimbangkan fraksi dalam penyebut, , jika semakin besar, maka akan semakin besar juga (walaupun lebih lambat), karena akar kuadrat adalah transformasi monotonik. Karena akar kuadrat dari adalah penyebut dari fraksi itu, karena semakin besar, fraksi akan semakin kecil. Namun, fraksi ini, pada gilirannya, adalah penyebut. Akibatnya, ketika penyebutnya semakin kecil, fraksi kedua semakin besar. Dengan demikian, nilai- akan semakin besar karena semakin besar. (Dengan asumsi, sekali lagi, itu $N$ $t$ $\hat\sigma/\sqrt{n}$ $n$ $\sqrt n$ $n$ $t$ $n$ $\hat\sigma$ dan tetap sama.) $(\bar x - \mu_{\rm null})$

Apa artinya ini secara konseptual? Nah, semakin banyak data yang kita miliki / semakin dekat ukuran sampel dengan ukuran populasi, semakin sedikit rata-rata sampel akan cenderung bervariasi dari rata-rata populasi karena kesalahan pengambilan sampel (lih., Hukum jumlah besar ). Dengan populasi terbatas yang kecil, ini mudah dilihat, tetapi meskipun mungkin tidak intuitif, hal yang sama berlaku jika populasi tidak terbatas. Karena mean sampel ( $\bar x$ ) seharusnya tidak berfluktuasi sangat jauh dari nilai referensi (nol), kita dapat lebih yakin bahwa jarak rata-rata sampel yang diamati dari nol adalah karena nilai nol sebenarnya bukan rata-rata populasi dari mana sampel diambil. . Lebih tepatnya, semakin kecil kemungkinan untuk menemukan sampel rata-rata yang jauh atau lebih jauh dari nilai nol, jika nilai nol benar-benar merupakan rata-rata populasi dari mana sampel diambil.
$t$ distribusi

Ketika Anda melihat tabel- (katakanlah, di belakang buku statistik), apa yang sebenarnya Anda lihat adalah tabel nilai kritis . Artinya, nilai yang statistik yang diamati harus lebih besar daripada agar tes menjadi 'signifikan' pada alpha itu. (Biasanya, ini terdaftar untuk sejumlah kecil kemungkinan : .) Saya menduga jika Anda perhatikan tabel-tabel tersebut, mereka sebenarnya berpikir dalam hal derajat kebebasan yang terkait dengan statistik yang bersangkutan. Perhatikan bahwa derajat kebebasan untuk statistik- adalah fungsi dari , menjadi $t$ $t$ $\alpha=\{.10,\ .05,\ .01,\ .001\}$ $t$ $t$ $n$ $df = n-2$ untuk dua kelompok -test, atau untuk satu kelompok -test (contoh Anda tampaknya adalah yang terakhir). Ini berkaitan dengan fakta bahwa distribusi akan menyatu dengan distribusi normal standar ketika derajat kebebasan mendekati tak terhingga. $t$ $df = n-1$ $t$ $t$

Cara untuk memahami ini secara konseptual adalah dengan memikirkan mengapa Anda perlu menggunakan distribusi- sejak awal. Anda tahu nilai rata-rata referensi yang Anda minati dan sampel yang Anda amati. Jika populasi dari mana sampel diambil berdistribusi normal (yang orang sering berasumsi secara implisit), maka kita tahu bahwa distribusi sampling dari mean akan terdistribusi secara normal juga. Jadi mengapa repot-repot dengan distribusi- ? Jawabannya adalah yang tidak yakin apa standar deviasi populasi. (Jika kami yakin, kami benar-benar akan menggunakan distribusi normal, yaitu, -test bukan -test.) Jadi kami menggunakan standar deviasi sampel kami, $t$ $t$ $z$ $t$ $\hat\sigma$ , sebagai proxy untuk nilai populasi yang tidak diketahui. Namun, semakin banyak data yang kita miliki, semakin yakin kami dapat bahwa adalah sebenarnya sekitar nilai yang tepat. Sebagai mendekati ukuran populasi (dan / atau tak terhingga), kita dapat yakin bahwa sebenarnya adalah persis nilai yang tepat. Dengan demikian, distribusi- menjadi distribusi normal . $\hat\sigma$ $n$ $\hat\sigma$ $t$

gung - Pasang kembali Monica
sumber

Itu jawaban yang sangat panjang. Mengapa tidak memindahkannya dari komentar menjadi jawabannya?

Harvey Motulsky

Terima kasih, @ HarveyMotulsky. Apa yang Anda maksud dengan kalimat terakhir? Itu diposting sebagai jawaban, bukan komentar.

gung - Reinstate Monica

Entah ada sesuatu yang berubah pada menit terakhir, atau saya melihatnya salah. Ini adalah jawaban yang bagus, dan diposting seperti itu.

Harvey Motulsky

Apakah ini berarti bahwa n yang kita gunakan dalam rumus t-value tidak ada hubungannya dengan rumus yang digunakan untuk menghasilkan nilai-t kritis? Apa yang saya bingung dengan sebagai df (yang merupakan fungsi dari n) meningkat dalam t tabel, nilai-kritis t menurun sedangkan itu tidak terjadi dalam nilai-t dari rumus dalam pertanyaan asli. Meskipun kita melihat n yang sama di kedua tempat (tabel dan formula), namun, mereka bertindak berbeda.

leviathan

(Kebetulan, saya yakin jawaban saya ditujukan untuk pertanyaan Anda yang telah diedit. Beri tahu saya jika masih ada kejelasan.)

gung - Reinstate Monica

Nah, jawaban singkatnya adalah itulah yang tidak masuk hitungan. Jawaban panjangnya adalah mengerjakan matematika . Sebagai gantinya saya akan mencoba untuk mengulangi penjelasan gung bahwa ini adalah dua hal yang berbeda (meskipun terkait) $^3$

Anda telah mengumpulkan sampel yang biasanya didistribusikan dengan varian tidak dikenal dan ingin tahu apakah rata-ratanya berbeda dari beberapa nilai yang ditentukan . Cara Anda melakukan ini adalah menghitung nilai yang mewakili seberapa "berbeda" pengamatan Anda dari asumsi bahwa . Dengan demikian rumus untuk -statistic Anda disajikan. Mungkin cara berpikir yang paling intuitif tentang mengapa ini meningkat dengan adalah bahwa Anda memiliki lebih banyak "kepercayaan diri" bahwa segala sesuatu berbeda ketika Anda memiliki lebih banyak sampel. $X_1...X_n$ $^4$ $\mu$ $\bar{x}=\mu$ $t$ $^1$ $n$

Selanjutnya, nilai ini mengikuti distribusi- dengan derajat kebebasan. Cara berpikir tentang ini adalah bahwa distribusi- sedikit berbeda tergantung pada ukuran sampel Anda. Anda dapat melihat plot distribusi ini dengan 2, 3, 5, dan 20 df di bawah ini. Anda akan melihat bahwa df yang lebih tinggi memiliki massa lebih banyak di tengah dan kurang di ekor distribusi (saya tidak memiliki alasan intuitif mengapa distribusi tersebut berperilaku seperti ini, maaf). Kritis $t$ $^2$ $n-1$ $t$ distribusi t, df = 2,3,5,20 $t$ -nilai adalah x-lokasi di mana area di bawah kurva sama dengan nilai yang agak sewenang-wenang yang Anda pilih (tradisional 0,05). Nilai-nilai ini ditandai pada grafik sebagai titik. Jadi untuk kurva hijau (df = 5), area di bawah kurva di sebelah kiri titik hijau kiri = 0,025, dan area di bawah kurva di sebelah kanan dari titik hijau kanan = 0,025, dengan total 0,05.

Inilah sebabnya mengapa nilai kritis menurun dengan meningkatnya derajat kebebasan - karena jika meningkat, nilai kritis harus mendekati nol untuk menjaga area yang sama di bawah kurva. Dan seperti yang disebutkan gung, ketika df pergi ke , kurva dan nilai kritis akan mendekati distribusi normal standar. $t$ $\infty$

Jadi sekarang Anda memiliki nilai kritis dan statistik Anda, dan dapat melakukan uji- . Jika statistik- Anda lebih besar dari nilai kritis, Anda kemudian dapat membuat pernyataan bahwa jika benar-benar benar, maka Anda akan mengamati sampel Anda kurang dari 5% (atau persentase sewenang-wenang apa pun yang Anda pilih untuk menghitung nilai kritis untuk) waktu. $t$ $t$ $t$ $\bar{x}=\mu$

$^1$ Mengapa kita menghitung nilai khusus ini dari banyak nilai arbitrer yang bisa kita hitung? Nah, inilah yang jatuh dari perhitungan uji rasio kemungkinan . Jika Anda tahu varians sampel sebelumnya, -statistic (mengikuti distribusi normal) yang disebutkan oleh gung akan jatuh dari perhitungan ini sebagai gantinya, dan Anda akan melakukan -test Sekali lagi, inilah yang jatuh dari math Hasil bagus pertama dari google: http://math.arizona.edu/~jwatkins/ttest.pdf Ternyata uji-t bekerja bahkan jika asumsi itu tidak terpenuhi, tetapi itu adalah penyimpangan $^3$
$z$ $z$
$^2$ $^3$
$^3$
$^4$

Affine
sumber