Jawaban ini ada dalam dua bagian utama: pertama, menggunakan interpolasi linier , dan kedua, menggunakan transformasi untuk interpolasi yang lebih akurat. Pendekatan yang dibahas di sini cocok untuk perhitungan tangan ketika Anda memiliki tabel terbatas, tetapi jika Anda menerapkan rutinitas komputer untuk menghasilkan nilai-p, ada banyak pendekatan yang lebih baik (jika membosankan jika dilakukan dengan tangan) yang harus digunakan sebagai gantinya.
Jika Anda tahu bahwa nilai kritis 10% (satu ekor) untuk z-test adalah 1,28 dan nilai kritis 20% adalah 0,84, tebakan kasar pada nilai kritis 15% akan menjadi setengah jalan antara - (1,28 + 0,84) / 2 = 1.06 (nilai aktual adalah 1.0364), dan nilai 12.5% dapat ditebak di tengah-tengah antara itu dan nilai 10% (1.28 + 1.06) / 2 = 1.17 (nilai aktual 1.15+). Inilah yang dilakukan oleh interpolasi linier - tetapi alih-alih 'setengah jalan antara', interpolasi linier melihat, di mana ada fraksi jalan antara dua nilai.
Interpolasi linier univariat
Mari kita lihat kasus interpolasi linier sederhana.
Jadi kami memiliki beberapa fungsi (katakanlah ) yang menurut kami kira-kira linear di dekat nilai yang kami coba perkirakan, dan kami memiliki nilai fungsi di kedua sisi nilai yang kami inginkan, misalnya, seperti:x
x81620y9.3y1615.6
Kedua nilai yang y 's kita tahu adalah 12 (20-8) terpisah. Lihat bagaimana nilai- x (nilai yang kita inginkan untuk nilai- y untuk) membagi selisih 12 ke atas dalam rasio 8: 4 (16-8 dan 20-16)? Artinya, jaraknya 2/3 dari nilai x pertama sampai yang terakhir. Jika hubungannya linier, rentang nilai y yang sesuai akan berada dalam rasio yang sama.xyxyx
Jadi harus kira-kira sama dengan16-8y16−9.315.6−9.3 .16−820−8
Itu y16−9.315.6−9.3≈16−820−8
menata ulang:
y16≈9.3+(15.6−9.3)16−820−8=13.5
Contoh dengan tabel statistik: jika kita memiliki t-tabel dengan nilai kritis berikut untuk 12 df:
(2-tail)α0.010.020.050.10t3.052.682.181.78
Kami ingin nilai kritis t dengan 12 df dan alfa dua sisi 0,025. Artinya, kami menginterpolasi antara baris 0,02 dan 0,05 dari tabel itu:
α0.020.0250.05t2.68?2.18
Nilai pada " " Adalah nilai t 0,025 yang ingin kami gunakan untuk interpolasi linier. (Dengan t 0,025 sebenarnya saya maksud 1 - 0,025 / 2 titik dari invers cdf dari distribusi t 12. )?t0.025t0.0251−0.025/2t12
Seperti sebelumnya, membagi interval dari 0,02 ke 0,05 dalam rasio ( 0,025 - 0,02 ) hingga ( 0,05 - 0,025 ) (yaitu 1 : 5 ) dan nilai- t yang tidak diketahui harus membagi rentang t0.0250.020.05(0.025−0.02)(0.05−0.025)1:5tt hingga 2,18 dalam rasio yang sama; ekuivalen, 0,025 terjadi ( 0,025 - 0,02 ) / ( 0,05 - 0,02 ) = 1 /2.682.180.025 th dari jalan di sepanjang x bintang tiga, sehingga tidak diketahui t -nilai harus terjadi 1 / 6 th dari jalan di sepanjang t bintang tiga.(0.025−0.02)/(0.05−0.02)=1/6xt1/6t
Itu adalah atau setarat0.025−2.682.18−2.68≈0.025−0.020.05−0.02
t0.025≈2.68+(2.18−2.68)0.025−0.020.05−0.02=2.68−0.516≈2.60
Jawaban aktualnya adalah ... yang tidak terlalu dekat karena fungsi yang kami aproksimasi tidak terlalu dekat dengan linear dalam rentang itu (lebih dekat α = 0,5 ).2.56α=0.5
Perkiraan yang lebih baik melalui transformasi
Kita dapat mengganti interpolasi linier dengan bentuk fungsional lainnya; pada dasarnya, kami mentransformasikan ke skala di mana interpolasi linier bekerja lebih baik. Dalam hal ini, pada bagian ekor, banyak nilai kritis yang ditabulasi lebih linier dari tingkat signifikansi. Setelah kami mengambil log , kami hanya menerapkan interpolasi linier seperti sebelumnya. Mari kita coba pada contoh di atas:loglog
α0.020.0250.05log(α)−3.912−3.689−2.996t2.68t0.0252.18
Sekarang
t0.025−2.682.18−2.68≈=log(0.025)−log(0.02)log(0.05)−log(0.02)−3.689−−3.912−2.996−−3.912
atau setara
t0.025≈=2.68+(2.18−2.68)−3.689−−3.912−2.996−−3.9122.68−0.5⋅0.243≈2.56
Yang benar untuk jumlah angka yang dikutip. Ini karena - ketika kita mengubah skala x secara logaritmik - hubungannya hampir linier:
Memang, secara visual kurva (abu-abu) terletak rapi di atas garis lurus (biru).
Dalam beberapa kasus, logit dari tingkat signifikansi ( logit ( α ) = log( α1 - α) = log( 11 - α- 1 )αcatatan
Interpolasi di berbagai tingkat kebebasan
tFν†1 / ν
120 / ν120 / ν
F4 , νν= 601201 / νν= 80F
F4 , 80 , .95≈ F4 , 60 , .95+ 1 / 80 - 1 / 601 / 120 - 1 / 60⋅ ( F4 , 120 , .95−F4,60,.95)
(Bandingkan dengan diagram di sini )
†
Ini sepotong meja chi-squared
Probability less than the critical value
df 0.90 0.95 0.975 0.99 0.999
______ __________________________________________________
40 51.805 55.758 59.342 63.691 73.402
50 63.167 67.505 71.420 76.154 86.661
60 74.397 79.082 83.298 88.379 99.607
70 85.527 90.531 95.023 100.425 112.317
Bayangkan kita ingin menemukan nilai kritis 5% (persentil ke-95) untuk 57 derajat kebebasan.
Melihat lebih dekat, kita melihat bahwa nilai-nilai kritis 5% dalam tabel berkembang hampir secara linear di sini:
(garis hijau bergabung dengan nilai untuk 50 dan 60 df; Anda dapat melihatnya menyentuh titik untuk 40 dan 70)
Jadi interpolasi linier akan sangat baik. Tetapi tentu saja kita tidak punya waktu untuk menggambar grafik; bagaimana memutuskan kapan harus menggunakan interpolasi linier dan kapan mencoba sesuatu yang lebih rumit?
(x50,0.95+x70,0.95)/2x60,0.95
(67.505+90.531)/2=79.018 , yang bila dibandingkan dengan nilai aktual untuk 60 df, 79.082, kita dapat melihat akurat hingga hampir tiga angka penuh, yang biasanya cukup baik untuk interpolasi, jadi dalam kasus ini, Anda akan tetap dengan interpolasi linier; dengan langkah yang lebih baik untuk nilai yang kita butuhkan sekarang kita harapkan untuk memiliki keakuratan 3 angka secara efektif
x−67.50579.082−67.505≈57−5060−50
x≈67.505+(79.082−67.505)⋅57−5060−50≈75.61 .
Nilai sebenarnya adalah 75.62375, jadi kami memang mendapatkan 3 angka akurasi dan hanya keluar dengan 1 pada angka keempat.
Interpolasi yang lebih akurat masih dapat dilakukan dengan menggunakan metode perbedaan hingga (khususnya, melalui perbedaan yang dibagi), tetapi ini mungkin berlebihan untuk sebagian besar masalah pengujian hipotesis.
Jika derajat kebebasan Anda melewati ujung meja Anda, pertanyaan ini membahas masalah itu.