Bagaimana cara menemukan nilai yang tidak diberikan dalam tabel statistik (interpolasi dalam)?

Jawaban ini ada dalam dua bagian utama: pertama, menggunakan interpolasi linier , dan kedua, menggunakan transformasi untuk interpolasi yang lebih akurat. Pendekatan yang dibahas di sini cocok untuk perhitungan tangan ketika Anda memiliki tabel terbatas, tetapi jika Anda menerapkan rutinitas komputer untuk menghasilkan nilai-p, ada banyak pendekatan yang lebih baik (jika membosankan jika dilakukan dengan tangan) yang harus digunakan sebagai gantinya.

Jika Anda tahu bahwa nilai kritis 10% (satu ekor) untuk z-test adalah 1,28 dan nilai kritis 20% adalah 0,84, tebakan kasar pada nilai kritis 15% akan menjadi setengah jalan antara - (1,28 + 0,84) / 2 = 1.06 (nilai aktual adalah 1.0364), dan nilai 12.5% dapat ditebak di tengah-tengah antara itu dan nilai 10% (1.28 + 1.06) / 2 = 1.17 (nilai aktual 1.15+). Inilah yang dilakukan oleh interpolasi linier - tetapi alih-alih 'setengah jalan antara', interpolasi linier melihat, di mana ada fraksi jalan antara dua nilai.

Interpolasi linier univariat

Mari kita lihat kasus interpolasi linier sederhana.

Jadi kami memiliki beberapa fungsi (katakanlah ) yang menurut kami kira-kira linear di dekat nilai yang kami coba perkirakan, dan kami memiliki nilai fungsi di kedua sisi nilai yang kami inginkan, misalnya, seperti: $x$

\begin{array}{cc} x & y \\ 8 & 9.3 \\ 16 & y_{16} \\ 20 & 15.6 \end{array}

$\begin{array}{ c c } x & y\\ 8 & 9.3\\ 16 & y_{16}\\ 20 & 15.6\\ \end{array}$

Kedua nilai yang 's kita tahu adalah 12 (20-8) terpisah. Lihat bagaimana nilai- (nilai yang kita inginkan untuk nilai- untuk) membagi selisih 12 ke atas dalam rasio 8: 4 (16-8 dan 20-16)? Artinya, jaraknya 2/3 dari nilai pertama sampai yang terakhir. Jika hubungannya linier, rentang nilai y yang sesuai akan berada dalam rasio yang sama. $x$ $y$ $x$ $y$ $x$

interpolasi linier

Jadi harus kira-kira sama dengan $\frac{y_{16} - 9.3}{15.6 - 9.3}$ . $\frac{16-8}{20-8}$

Itu $\frac{y_{16} - 9.3}{15.6 - 9.3} \approx \frac{16-8}{20-8}$

menata ulang:

$y_{16} \approx 9.3 + (15.6 - 9.3) \frac{16-8}{20-8} = 13.5$

Contoh dengan tabel statistik: jika kita memiliki t-tabel dengan nilai kritis berikut untuk 12 df:

\begin{array}{cc} (2 -tail) \\ α & t \\ 0.01 & 3.05 \\ 0.02 & 2.68 \\ 0.05 & 2.18 \\ 0.10 & 1.78 \end{array}

$\begin{array}{ c c } (2\text{-tail})& \\ α & t\\ 0.01 & 3.05\\ 0.02 & 2.68\\ 0.05 & 2.18\\ 0.10 & 1.78 \end{array}$

Kami ingin nilai kritis t dengan 12 df dan alfa dua sisi 0,025. Artinya, kami menginterpolasi antara baris 0,02 dan 0,05 dari tabel itu:

\begin{array}{cc} α & t \\ 0.02 & 2.68 \\ 0.025 & ? \\ 0.05 & 2.18 \end{array}

$\begin{array}{ c c } α & t\\ 0.02 & 2.68\\ 0.025 & \text{?}\\ 0.05 & 2.18\\ \end{array}$

Nilai pada " " Adalah nilai yang ingin kami gunakan untuk interpolasi linier. (Dengan sebenarnya saya maksud titik dari invers cdf dari distribusi ) $\text{?}$ $t_{0.025}$ $t_{0.025}$ $1-0.025/2$ $t_{12}$

Seperti sebelumnya, membagi interval dari ke dalam rasio hingga (yaitu ) dan nilai- tidak diketahui harus membagi rentang $0.025$ $0.02$ $0.05$ $(0.025-0.02)$ $(0.05-0.025)$ $1:5$ $t$ $t$ hingga dalam rasio yang sama; ekuivalen, terjadi $2.68$ $2.18$ $0.025$ th dari jalan di sepanjang bintang tiga, sehingga tidak diketahui -nilai harus terjadi th dari jalan di sepanjang bintang tiga. $(0.025-0.02)/(0.05-0.02) = 1/6$ $x$ $t$ $1/6$ $t$

Itu adalah atau setara $\frac{t_{0.025}-2.68}{2.18-2.68} \approx \frac{0.025-0.02}{0.05-0.02}$

$t_{0.025} \approx 2.68 + (2.18-2.68) \frac{0.025-0.02}{0.05-0.02} = 2.68 - 0.5 \frac{1}{6} \approx 2.60$

Jawaban aktualnya adalah ... yang tidak terlalu dekat karena fungsi yang kami aproksimasi tidak terlalu dekat dengan linear dalam rentang itu (lebih dekat ). $2.56$ $\alpha = 0.5$

interpolasi linier dari nilai kritis dalam t-tabel

Perkiraan yang lebih baik melalui transformasi

Kita dapat mengganti interpolasi linier dengan bentuk fungsional lainnya; pada dasarnya, kami mentransformasikan ke skala di mana interpolasi linier bekerja lebih baik. Dalam hal ini, pada bagian ekor, banyak nilai kritis yang ditabulasi lebih linier dari tingkat signifikansi. Setelah kami mengambil , kami hanya menerapkan interpolasi linier seperti sebelumnya. Mari kita coba pada contoh di atas: $\log$ $\log$

\begin{array}{cc} α & \log (α) & t \\ 0.02 & - 3.912 & 2.68 \\ 0.025 & - 3.689 & t_{0.025} \\ 0.05 & - 2.996 & 2.18 \end{array}

$\begin{array}{ c c } α & \log(α)& t\\ 0.02 & -3.912 & 2.68\\ 0.025& -3.689 & t_{0.025}\\ 0.05 & -2.996 & 2.18\\ \end{array}$

Sekarang

\begin{array}{rcl} \frac{t_{0.025} - 2.68}{2.18 - 2.68} & \approx & \frac{\log (0.025) - \log (0.02)}{\log (0.05) - \log (0.02)} \\ = & \frac{- 3.689 - - 3.912}{- 2.996 - - 3.912} \end{array}

$\begin{eqnarray} \frac{t_{0.025}-2.68}{2.18-2.68} &\approx& \frac{\log(0.025)-\log(0.02)}{\log(0.05)-\log(0.02)} \\ &=& \frac{-3.689 - -3.912}{-2.996 - -3.912}\\ \end{eqnarray}$

atau setara

\begin{array}{rcl} t_{0.025} & \approx & 2.68 + (2.18 - 2.68) \frac{- 3.689 - - 3.912}{- 2.996 - - 3.912} \\ = & 2.68 - 0.5 \cdot 0.243 \approx 2.56 \end{array}

$\begin{eqnarray} t_{0.025} &\approx& 2.68 + (2.18-2.68) \frac{-3.689 - -3.912}{-2.996 - -3.912}\\ &=& 2.68 - 0.5 \cdot 0.243 \approx 2.56 \end{eqnarray}$

Yang benar untuk jumlah angka yang dikutip. Ini karena - ketika kita mengubah skala x secara logaritmik - hubungannya hampir linier:

interpolasi linier dalam log alpha
Memang, secara visual kurva (abu-abu) terletak rapi di atas garis lurus (biru).

Dalam beberapa kasus, logit dari tingkat signifikansi ( $\text{logit}(\alpha)=\log(\frac{α}{1-α})=\log(\frac{1}{1-α}-1)$ $\alpha$ $\log$

Interpolasi di berbagai tingkat kebebasan

$t$ $F$ $\nu$ $^\dagger$ $1/\nu$

$120/\nu$ $120/\nu$

$F_{4,\nu}$ $\nu = 60$ $120$ $1/\nu$ $\nu=80$ $F$

F_{4, 80, .95} \approx F_{4, 60, .95} + \frac{1 / 80 - 1 / 60}{1 / 120 - 1 / 60} \cdot (F_{4, 120, .95} - F_{4, 60, .95})

$F_{4,80,.95} \approx F_{4,60,.95} + \frac{1/80 - 1/60}{1/120 - 1/60} \cdot (F_{4,120,.95}-F_{4,60,.95})$

invers interp dalam df

(Bandingkan dengan diagram di sini )

$^\dagger$

Ini sepotong meja chi-squared

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

Bayangkan kita ingin menemukan nilai kritis 5% (persentil ke-95) untuk 57 derajat kebebasan.

Melihat lebih dekat, kita melihat bahwa nilai-nilai kritis 5% dalam tabel berkembang hampir secara linear di sini:

(garis hijau bergabung dengan nilai untuk 50 dan 60 df; Anda dapat melihatnya menyentuh titik untuk 40 dan 70)

Jadi interpolasi linier akan sangat baik. Tetapi tentu saja kita tidak punya waktu untuk menggambar grafik; bagaimana memutuskan kapan harus menggunakan interpolasi linier dan kapan mencoba sesuatu yang lebih rumit?

$(x_{50,0.95}+x_{70,0.95})/2$ $x_{60,0.95}$

$(67.505+90.531)/2 = 79.018$ , yang bila dibandingkan dengan nilai aktual untuk 60 df, 79.082, kita dapat melihat akurat hingga hampir tiga angka penuh, yang biasanya cukup baik untuk interpolasi, jadi dalam kasus ini, Anda akan tetap dengan interpolasi linier; dengan langkah yang lebih baik untuk nilai yang kita butuhkan sekarang kita harapkan untuk memiliki keakuratan 3 angka secara efektif

$\frac{x-67.505}{79.082-67.505} \approx {57-50}{60-50}$

$x\approx 67.505+(79.082-67.505)\cdot {57-50}{60-50}\approx 75.61$ .

Nilai sebenarnya adalah 75.62375, jadi kami memang mendapatkan 3 angka akurasi dan hanya keluar dengan 1 pada angka keempat.

Interpolasi yang lebih akurat masih dapat dilakukan dengan menggunakan metode perbedaan hingga (khususnya, melalui perbedaan yang dibagi), tetapi ini mungkin berlebihan untuk sebagian besar masalah pengujian hipotesis.

Jika derajat kebebasan Anda melewati ujung meja Anda, pertanyaan ini membahas masalah itu.

Glen_b -Reinstate Monica
sumber

Bagaimana cara menemukan nilai yang tidak diberikan dalam tabel statistik (interpolasi dalam)?

Jawaban:

Interpolasi linier univariat

Perkiraan yang lebih baik melalui transformasi

Interpolasi di berbagai tingkat kebebasan