Misalkan kita memiliki dua titik (gambar berikut: lingkaran hitam) dan kami ingin menemukan nilai untuk titik ketiga di antara mereka (silang). Memang kita akan memperkirakannya berdasarkan hasil percobaan kita, titik hitam. Kasus paling sederhana adalah menggambar garis dan kemudian menemukan nilai (yaitu, interpolasi linier). Jika kita memiliki titik-titik pendukung misalnya, karena titik-titik cokelat di kedua sisi kita lebih suka untuk mendapatkan manfaat dari mereka dan cocok dengan kurva non-linear (kurva hijau).
Pertanyaannya adalah apa alasan statistik untuk menandai palang merah sebagai solusinya? Mengapa persilangan lain (mis. Yang kuning) bukan jawaban di mana mereka bisa berada? Inferensi macam apa atau (?) Mendorong kita untuk menerima yang merah?
Saya akan mengembangkan pertanyaan asli saya berdasarkan jawaban yang didapat untuk pertanyaan yang sangat sederhana ini.
sumber
Jawaban:
Segala bentuk penyesuaian fungsi, bahkan yang nonparametrik (yang biasanya membuat asumsi tentang kelancaran kurva yang terlibat), melibatkan asumsi, dan dengan demikian lompatan iman.
Solusi kuno interpolasi linier adalah salah satu yang 'hanya berfungsi' ketika data yang Anda miliki 'cukup' (jika Anda melihat lingkaran cukup dekat, terlihat datar juga - tanyakan saja pada Columbus), dan layak bahkan sebelum zaman komputer (yang tidak berlaku untuk banyak solusi splines modern). Masuk akal untuk mengasumsikan keyakinan bahwa fungsi akan 'melanjutkan dalam hal yang sama (yaitu linear)' antara dua poin, tetapi tidak ada alasan apriori untuk ini (kecuali pengetahuan tentang konsep yang ada).
Menjadi jelas dengan cepat ketika Anda memiliki tiga (atau lebih) titik noncolinear (seperti ketika Anda menambahkan titik-titik coklat di atas), bahwa interpolasi linier antara masing-masing akan segera melibatkan sudut tajam di masing-masing, yang biasanya tidak diinginkan. Di situlah pilihan lain masuk.
Namun, tanpa pengetahuan domain lebih lanjut, tidak ada cara untuk menyatakan dengan pasti bahwa satu solusi lebih baik daripada yang lain (untuk ini, Anda harus tahu apa nilai poin-poin lainnya, mengalahkan tujuan pemasangan fungsi dalam tempat pertama).
Sisi baiknya, dan mungkin lebih relevan dengan pertanyaan Anda, di bawah 'kondisi keteraturan' (baca: asumsi : jika kita tahu bahwa fungsinya halus), interpolasi linier dan solusi populer lainnya dapat dibuktikan 'masuk akal' perkiraan Tetap: itu memerlukan asumsi, dan untuk ini, kami biasanya tidak memiliki statistik.
sumber
Anda dapat menghitung persamaan linier untuk garis paling cocok (misalnya. Y = 0,4554x + 0,7525) namun ini hanya akan berfungsi jika ada sumbu berlabel. Namun ini tidak akan memberi Anda jawaban yang tepat hanya yang paling pas dalam kaitannya dengan poin lainnya.
sumber