Kebingungan mengenai kapan harus menggunakan

15

Saya merujuk pada video ceramah ini untuk menghitung interval kepercayaan . Namun, saya memiliki beberapa kebingungan. Orang ini menggunakan statistik untuk perhitungan. Namun, saya pikir itu seharusnya statistik. Kami tidak diberi standar deviasi populasi yang sebenarnya. Kami menggunakan standar deviasi sampel untuk memperkirakan yang benar. $z$ $t$

Jadi mengapa dia mengambil distribusi normal untuk interval kepercayaan daripada ? $t$

confidence-interval t-distribution pengguna34790
sumber

2

kemungkinan rangkap dari Haruskah interval kepercayaan untuk koefisien regresi linier didasarkan pada distribusi normal atau

?

t

$t$

Makro

Hanya sebagai referensi, bekerja di luar masalah terkena pada video dengan t statistik akan menghasilkan: n <- 36; diff <- 12; sd <- 40; 2 * (pt(diff/(sd/sqrt(n)), df = n - 1) - 0.5) = 0.9195145.

Antoni Parellada

10

Anda benar, seharusnya distribusi-t. Tetapi karena ukuran sampel adalah 36 (yaitu> 20), distribusi az juga sesuai. Ingat, ketika ukuran sampel bertambah, distribusi t menjadi lebih mirip dengan distribusi z dalam bentuk.

Kulit abu-abu
sumber

21

Kembali ketika saya mengambil kursus statistik pertama saya (setelah dinosaurus, tetapi ketika komputer nyata masih mengambil seluruh ruangan) kami diajarkan untuk menggunakan tabel z jika ada lebih dari 30 derajat kebebasan, sebagian karena t tabel dalam buku hanya naik hingga 30 derajat kebebasan dan jika Anda melihat tabel-t Anda akan melihat bahwa di suatu tempat sekitar 28 derajat kebebasan Anda mendapatkan hasil yang sama seperti tabel z hingga 2 digit signifikan (dan ketika melakukan semua itu dengan tangan kami cenderung untuk membulatkan lebih sering). Mungkin presenternya masih dari sekolah itu.

Anda benar bahwa jika Anda menggunakan standar deviasi sampel untuk pengujian dengan maksud bahwa Anda benar-benar harus menggunakan distribusi t terlepas dari ukurannya (yang jauh lebih mudah dilakukan hari ini) dan hanya menggunakan z (standar normal) ketika Anda ketahui deviasi standar populasi, tetapi untuk tujuan praktis Anda tidak akan sering melihat perbedaan yang berarti jika ukuran sampel besar.

Greg Snow
sumber

1

Anekdot yang bagus :)

swiecki

Salah satu efek samping yang tidak menguntungkan dari fakta bahwa kadang-kadang OK untuk menggunakan interval z adalah bahwa beberapa teks pengantar menyajikan interval z daripada interval t. Ada banyak bidang sains di mana sampel secara rutin cukup kecil sehingga interval z benar-benar tidak pantas. Saya memberi tahu siswa saya tentang hal ini setiap tahun, dengan instruksi eksplisit tetapi masih banyak dari mereka menggunakan interval-z :-(

Michael Lew - mengembalikan Monica

4

Saya mengalami kesulitan mencari tahu apakah Khan lebih dari hal-hal yang disederhanakan dalam video atau dia salah. Saya harus mengatakan yang terakhir, tetapi masalahnya bukan pada pertanyaan z atau t . Dia menyebut apa yang dia hitung interval kepercayaan dan kemudian mengatakan bahwa dia 92% yakin bahwa populasi berarti berada dalam kisaran yang diberikan. Sederhananya itu bukan sesuatu yang Anda simpulkan dari interval kepercayaan ... sayangnya.

Jadi saya kembali ke pertanyaan t vs z dan mulai bertanya-tanya apakah dia membuat kesalahan di sana. Saya berpikir bahwa mungkin bukan karena dia menyatakan bahwa jika sampel lebih kecil Anda harus melakukan koreksi. Jadi penjawab lain mungkin benar tentang itu. Dia hanya menggunakan z karena dia sudah memperkenalkannya dan itu cukup dekat dengan n dari 36. Saya tidak berencana untuk melihat semua video tapi saya membayangkan dia akan memperkenalkan distribusi t nanti, mudah-mudahan yang berikutnya.

Sangat disayangkan bahwa Khan Academy salah dalam banyak bidang statistik ... tapi mungkin aku merasa seperti itu karena aku hanya diarahkan ke video dengan masalah.

John
sumber

Kebingungan mengenai kapan harus menggunakan

Jawaban: