Sebagai contoh, saya memiliki data kerugian historis dan saya menghitung kuantil ekstrem (Value-at-Risk atau Probable Maximum Loss). Hasil yang diperoleh adalah untuk memperkirakan kerugian atau memperkirakannya? Di mana orang bisa menggambar garis? Saya bingung.
46
Jawaban:
"Prediksi" dan "estimasi" memang kadang-kadang digunakan secara bergantian dalam penulisan non-teknis dan mereka tampaknya berfungsi sama, tetapi ada perbedaan yang tajam di antara mereka dalam model standar masalah statistik. Sebuah estimator Data penggunaan menebak parameter sementara prediksi menggunakan data untuk menebak beberapa nilai acak yang bukan bagian dari dataset. Bagi mereka yang tidak terbiasa dengan apa arti "parameter" dan "nilai acak" dalam statistik, berikut ini memberikan penjelasan rinci.
Dalam model standar ini, data diasumsikan merupakan observasi (mungkin multivariat) dari variabel acak yang distribusinya hanya diketahui terletak di dalam set distribusi tertentu yang mungkin, "keadaan alamiah". Sebuah estimator adalah prosedur matematika yang ditunjuk untuk setiap nilai yang mungkin dari beberapa properti dari keadaan alam , seperti mean . Jadi perkiraan adalah dugaan tentang keadaan alam yang sebenarnya. Kita dapat mengetahui seberapa baik perkiraan dengan membandingkan dengan . Xx X x t ( x ) θ μ ( θ ) t ( x ) μ ( θ )t x t ( x ) θ μ(θ) t(x) μ(θ)
Sebuah prediksi menyangkut pengamatan independen lain variabel acak yang distribusinya terkait dengan keadaan sebenarnya dari alam. Prediksi adalah perkiraan tentang nilai acak lainnya. Kita dapat mengetahui seberapa baik prediksi tertentu hanya dengan membandingkan dengan nilai direalisasikan oleh . Kami berharap bahwa rata - rata perjanjian akan baik (dalam arti rata-rata atas semua kemungkinan hasil dan secara bersamaan atas semua nilai yang mungkin dari ).Z p ( x ) Z x Zp(x) Z p(x) Z x Z
Kuadrat terkecil biasa memberikan contoh standar. Data terdiri dari pasangan mengaitkan nilai dari variabel dependen ke nilai dari variabel independen. Keadaan alam ditentukan oleh tiga parameter , , dan : ia mengatakan bahwa setiap seperti gambar independen dari distribusi normal dengan mean dan standar deviasi . , , dan adalah parameter (angka) yang diyakini telah diperbaiki dan tidak berubah. Minat berfokus paday i x i α β σ y i α + β x i σ α β σ α β ( α , β ) α α β β α β(xi,yi) yi xi α β σ yi α+βxi σ α β σ α (intersep) dan (lereng). Perkiraan OLS, ditulis , baik dalam arti bahwa cenderung dekat dengan dan cenderung dekat dengan , tidak peduli apa nilai-nilai yang benar (tapi tidak diketahui) dari dan mungkin .β (α^,β^) α^ α β^ β α β
Prediksi OLS terdiri dari mengamati nilai baru dari variabel dependen yang terkait dengan beberapa nilai dari variabel independen. mungkin atau mungkin tidak termasuk di antara dalam dataset; itu tidak penting. Satu prediksi yang baik secara intuitif adalah bahwa nilai baru ini kemungkinan dekat dengan . Prediksi yang lebih baik mengatakan seberapa dekat nilai baru itu (mereka disebut interval prediksi ). Mereka menjelaskan fakta bahwa dan tidak pasti (karena mereka bergantung secara matematis pada nilai acakx x x i α + β x α β ( y i ) σ Y ( x ) σ α + β xZ=Y(x) x x xi α^+β^x α^ β^ (yi) ), bahwa tidak diketahui secara pasti (dan karena itu harus diperkirakan), serta asumsi bahwa memiliki distribusi normal dengan standar deviasi dan rata-rata ( perhatikan tidak adanya topi!).σ Y(x) σ α+βx
Perhatikan khususnya bahwa prediksi ini memiliki dua sumber ketidakpastian yang berbeda: ketidakpastian dalam data mengarah ke ketidakpastian dalam perkiraan kemiringan, intersep, dan standar deviasi residual ( ); selain itu, ada ketidakpastian berapa nilai akan terjadi. Ketidakpastian tambahan ini - karena adalah acak - menjadi ciri prediksi. Prediksi mungkin terlihat seperti taksiran (setelah semua, taksiran :-) dan bahkan mungkin memiliki rumus matematika yang sama ( terkadang bisa sama dengan(xi,yi) σ Y(x) Y(x) α^+β^x α+βx p(x) t(x) ), tetapi akan datang dengan jumlah ketidakpastian yang lebih besar dari perkiraan.
Di sini, kemudian, dalam contoh OLS, kita melihat perbedaannya dengan jelas: perkiraan menebak parameter (yang ditetapkan tetapi angka tidak diketahui), sedangkan prediksi menebak nilai kuantitas acak. Sumber kebingungan potensial adalah bahwa prediksi biasanya dibangun berdasarkan estimasi parameter dan bahkan mungkin memiliki rumus yang sama dengan estimator.
Dalam praktiknya, Anda dapat membedakan penaksir dari penaksir dengan dua cara:
tujuan : estimator berusaha mengetahui properti dari keadaan alami yang sebenarnya, sedangkan prediksi berusaha menebak hasil dari variabel acak; dan
ketidakpastian : seorang prediktor biasanya memiliki ketidakpastian yang lebih besar daripada penduga yang terkait, karena ketidakpastian tambahan dalam hasil variabel acak. Oleh karena itu prediktor yang terdokumentasi dengan baik dan dideskripsikan biasanya datang dengan pita ketidakpastian - interval prediksi - yang lebih luas dari pita ketidakpastian estimator, yang dikenal sebagai interval kepercayaan. Ciri khas interval prediksi adalah mereka dapat (secara hipotetis) menyusut ketika set data tumbuh, tetapi mereka tidak akan menyusut menjadi nol lebar - ketidakpastian dalam hasil acak "tidak dapat direduksi" - sedangkan lebar interval kepercayaan akan cenderung menyusut ke nol, sesuai dengan intuisi kami bahwa ketepatan estimasi dapat menjadi baik secara sewenang-wenang dengan jumlah data yang memadai.
Dalam menerapkan ini untuk menilai kerugian investasi potensial, pertama mempertimbangkan tujuan: apakah Anda ingin tahu berapa banyak Anda mungkin benar-benar kehilangan atas ini investasi (atau ini keranjang tertentu investasi) selama periode tertentu, atau Anda benar-benar hanya menebak apa kerugian yang diperkirakan (lebih dari investasi besar di dunia, mungkin)? Yang pertama adalah prediksi, yang terakhir perkiraan. Kemudian pertimbangkan ketidakpastian. Bagaimana jawaban Anda berubah jika Anda memiliki sumber daya yang hampir tak terbatas untuk mengumpulkan data dan melakukan analisis? Jika itu akan menjadi sangat tepat, Anda mungkin memperkirakan pengembalian yang diharapkan dari investasi, sedangkan jika Anda tetap sangat tidak yakin tentang jawabannya, Anda membuat prediksi.
Jadi, jika Anda masih tidak yakin dengan hewan mana yang Anda hadapi, tanyakan pada estimator / prediktor Anda ini: seberapa salah kemungkinannya dan mengapa? Melalui kedua kriteria (1) dan (2) Anda akan tahu apa yang Anda miliki.
sumber
Estimasi selalu untuk parameter yang tidak diketahui sedangkan prediksi untuk variabel acak.
sumber
Tidak ada perbedaan dalam model. Memang ada (sedikit) perbedaan dalam tindakan yang dilakukan. Estimasi adalah kalibrasi model probabilistik Anda menggunakan data ("belajar" dalam terminologi AI). Prediksi adalah "menebak" dari pengamatan di masa depan. Dengan asumsi "dugaan" ini didasarkan pada data masa lalu - ini mungkin merupakan kasus estimasi; seperti prediksi ketinggian orang berikutnya yang akan Anda temui menggunakan perkiraan tinggi rata-rata dalam populasi. Perhatikan bahwa prediksi itu tidak selalu merupakan contoh estimasi. Jenis kelamin orang berikutnya yang akan Anda temui, bukan parameter populasi dalam pengertian klasik; Memprediksi jenis kelamin, mungkin memerlukan beberapa estimasi, tetapi akan membutuhkan beberapa ...
Dalam kasus value-at-risk, prediksi dan estimasi bertepatan sejak prediksi kerugian Anda, adalah perkiraan estimasi kerugian.
sumber
Prediksi adalah penggunaan fungsi regresi sampel untuk memperkirakan nilai untuk variabel dependen yang dikondisikan pada beberapa nilai yang tidak teramati dari variabel independen.
Estimasi adalah proses atau teknik penghitungan parameter atau jumlah populasi yang tidak diketahui.
sumber
Biasanya "estimasi" dicadangkan untuk parameter dan "prediksi" adalah untuk nilai. Namun, kadang-kadang perbedaan menjadi kabur, misalnya Anda mungkin telah melihat sesuatu seperti "memperkirakan nilai besok" daripada "memprediksi nilai besok."
Value-at-risk (VaR) adalah kasus yang menarik. VaR bukan parameter, tetapi kami tidak mengatakan "prediksi VaR." Kami mengatakan "memperkirakan VaR." Mengapa?
Alasan dalam VaR itu bukan kuantitas acak JIKA Anda tahu distribusi, DAN Anda perlu tahu distribusi untuk menghitung VaR. Jadi, Anda jika Anda menggunakan pendekatan VaR parametrik, maka Anda pertama-tama memperkirakan parameter distribusi kemudian menghitung VaR. Jika Anda menggunakan VaR nonparametrik, maka Anda langsung memperkirakan VaR yang mirip dengan cara Anda memperkirakan parameter. Dalam hal ini mirip dengan kuantil.
Di sisi lain, jumlah kerugian adalah nilai acak. Karenanya, jika Anda diminta memperkirakan kerugian, Anda akan memperkirakannya tidak memperkirakan. Sekali lagi, kadang-kadang kita mengatakan "memperkirakan" kerugian. Jadi, garisnya kabur, seperti yang saya tulis sebelumnya.
sumber
Saya menemukan definisi di bawah ini lebih jelas:
Estimasi adalah perkiraan hasil yang dihitung. Hasil ini mungkin merupakan perkiraan tetapi tidak harus. Sebagai contoh, saya dapat memperkirakan bahwa jumlah mobil di Jembatan Golden Gate pukul 5 sore kemarin adalah 900 dengan mengasumsikan tiga jalur menuju Marin berada pada kapasitas, masing-masing mobil membutuhkan ruang 30 kaki, dan jembatan itu memiliki panjang 9000 kaki ( 9000/30 x 3 = 900).
Ekstrapolasi memperkirakan nilai suatu variabel di luar rentang nilai yang diketahui dengan mengasumsikan bahwa nilai estimasi mengikuti beberapa pola dari yang diketahui. Bentuk ekstrapolasi yang paling sederhana dan paling populer adalah memperkirakan tren linier berdasarkan data yang diketahui. Alternatif untuk ekstrapolasi linier termasuk ekstrapolasi polinomial dan kerucut. Seperti halnya estimasi, ekstrapolasi dapat digunakan untuk peramalan tetapi tidak terbatas pada peramalan.
Prediksi hanyalah mengatakan sesuatu tentang masa depan. Prediksi biasanya difokuskan pada hasil dan bukan jalur menuju hasil tersebut. Sebagai contoh, saya dapat memprediksi bahwa pada tahun 2050 semua kendaraan akan ditenagai motor listrik tanpa menjelaskan bagaimana kita dapatkan dari adopsi rendah pada tahun 2011 menjadi adopsi penuh pada tahun 2050. Seperti yang dapat Anda lihat dari contoh sebelumnya, prediksi tidak harus didasarkan pada data.
Peramalan adalah proses membuat perkiraan atau prediksi. Istilah ramalan dan prediksi sering digunakan secara bergantian tetapi terkadang ramalan dibedakan dari prediksi karena ramalan sering memberikan penjelasan tentang jalur menuju hasil. Misalnya, perkiraan adopsi kendaraan listrik mungkin termasuk jalur ke adopsi kendaraan listrik penuh mengikuti pola adopsi S-berbentuk di mana beberapa mobil listrik sebelum 2025, titik belok terjadi pada 2030 dengan adopsi cepat, dan mayoritas mobil listrik setelah 2040.
Estimasi, ekstrapolasi, prediksi, dan peramalan tidak saling melengkapi dan lengkap. Prakiraan jangka panjang yang baik untuk masalah yang kompleks seringkali perlu menggunakan teknik selain ekstrapolasi untuk menghasilkan hasil yang masuk akal. Prakiraan dan prediksi juga dapat terjadi tanpa estimasi yang dihitung.
lihat tautan definisi1 definisi2
sumber