Bagaimana cara menghitung ketidakpastian kemiringan regresi linier berdasarkan ketidakpastian data (mungkin dalam Excel / Mathematica)?
Contoh: Mari kita memiliki titik data (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16), tetapi setiap nilai y memiliki ketidakpastian 4. Sebagian besar fungsi yang saya temukan akan menghitung ketidakpastian sebagai 0, karena poinnya cocok dengan fungsi y = 2x. Tapi, seperti yang ditunjukkan pada gambar, y = x / 2 cocok dengan poinnya juga. Ini contoh yang dilebih-lebihkan, tapi saya harap ini menunjukkan apa yang saya butuhkan.
EDIT: Jika saya mencoba menjelaskan sedikit lebih banyak, sementara setiap titik dalam contoh memiliki nilai y tertentu, kami berpura-pura tidak tahu apakah itu benar. Misalnya titik pertama (0,0) sebenarnya bisa (0,6) atau (0, -6) atau apa pun di antaranya. Saya bertanya apakah ada algoritma di salah satu masalah populer yang memperhitungkan ini. Dalam contoh poin (0,6), (1,6,5), (2,7), (3,7,5), (4,8), ... (8, 10) masih jatuh dalam kisaran ketidakpastian, jadi mereka mungkin adalah titik yang tepat dan garis yang menghubungkan titik-titik tersebut memiliki persamaan: y = x / 2 + 6, sedangkan persamaan yang kita dapatkan dari tidak memperhitungkan faktor dalam ketidakpastian memiliki persamaan: y = 2x + 0. Jadi ketidakpastian k adalah 1,5 dan n adalah 6.
TL; DR: Dalam gambar, ada garis y = 2x yang dihitung menggunakan kuadrat terkecil dan cocok dengan data. Saya mencoba untuk menemukan berapa banyak k dan n di y = kx + n dapat berubah tetapi masih sesuai dengan data jika kita tahu ketidakpastian dalam nilai y. Dalam contoh saya, ketidakpastian k adalah 1,5 dan di n itu 6. Dalam gambar ada garis fit 'terbaik' dan garis yang hampir tidak cocok dengan titik.
sumber
Jawaban:
sumber
Saya melakukan sampling langsung naif dengan kode sederhana ini di Python:
dan dapatkan ini:
Tentu saja Anda dapat menambang
P
untuk data yang Anda inginkan, atau mengubah distribusi ketidakpastian.sumber
Saya pernah berburu yang sama sebelumnya dan saya pikir ini mungkin tempat yang berguna untuk memulai. Fungsi makro excel memberikan syarat fit linear dan ketidakpastiannya berdasarkan pada poin tabular dan ketidakpastian untuk setiap poin di kedua ordinat. Mungkin mencari makalah yang didasarkan pada untuk memutuskan apakah Anda ingin menerapkannya di lingkungan yang berbeda, memodifikasi, dll. (Ada beberapa kerja keras yang dilakukan untuk Mathematica.) Tampaknya memiliki dokumentasi walk-through yang baik di permukaan tetapi surga dapat membuka makro untuk melihat seberapa baik itu beranotasi.
sumber