Saya membaca " Pengantar Pembelajaran Statistik ". Dalam bab 2, mereka membahas alasan untuk memperkirakan fungsi .
2.1.1 Mengapa Memperkirakan ?
Ada dua alasan utama yang kami perkirakan untuk memperkirakan f : prediksi dan inferensi . Kami membahas masing-masing secara bergantian.
Saya sudah membacanya beberapa kali, tetapi saya masih belum jelas tentang perbedaan antara prediksi dan kesimpulan. Bisakah seseorang memberikan contoh (praktis) perbedaan?
prediction
terminology
causality
pengguna61629
sumber
sumber
Jawaban:
Inferensi: Diberikan seperangkat data yang ingin Anda simpulkan bagaimana output dihasilkan sebagai fungsi data.
Prediksi: Diberikan pengukuran baru, Anda ingin menggunakan set data yang ada untuk membangun model yang andal memilih pengidentifikasi yang benar dari serangkaian hasil.
Kesimpulan: Anda ingin mengetahui apa pengaruh Usia, Kelas Penumpang, dan Jenis Kelamin terhadap selamat dari Bencana Titanic. Anda dapat melakukan regresi logistik dan menyimpulkan efek masing-masing karakteristik penumpang pada tingkat kelangsungan hidup.
Prediksi: Diberikan beberapa informasi tentang penumpang Titanic, Anda ingin memilih dari himpunan dan koreksi sesering mungkin. (Lihat tradeoff varians bias untuk prediksi jika Anda bertanya-tanya bagaimana cara mengoreksi sesering mungkin.){ hidup , mati }
Prediksi tidak berkisar pada membangun hubungan yang paling akurat antara input dan output, prediksi akurat peduli menempatkan pengamatan baru ke kelas yang tepat sesering mungkin.
Jadi 'contoh praktis' secara kasar bermuara pada perbedaan berikut: Diberikan satu set data penumpang untuk satu penumpang, pendekatan inferensi memberi Anda kemungkinan selamat, pengklasifikasi memberi Anda pilihan antara hidup atau mati.
Tuning classifier adalah topik yang sangat menarik dan krusial dengan cara yang sama yang menginterpretasikan nilai-p dan interval kepercayaan dengan benar.
sumber
Secara umum ketika melakukan analisis data, kita membayangkan bahwa ada semacam "proses menghasilkan data" yang menimbulkan data, dan kesimpulan mengacu pada pembelajaran tentang struktur proses ini, sedangkan prediksi berarti dapat benar-benar memperkirakan data yang berasal darinya. . Seringkali keduanya berjalan bersama, tetapi tidak selalu.
Contoh di mana keduanya berjalan seiring akan menjadi model regresi linier sederhana
Inferensi dalam kasus ini berarti memperkirakan parameter model dan β 1 dan prediksi kami hanya akan dihitung dari estimasi parameter ini. Tetapi ada jenis model lain di mana seseorang dapat membuat prediksi yang masuk akal, tetapi model tersebut tidak selalu mengarah pada wawasan yang bermakna tentang apa yang terjadi di balik layar. Beberapa contoh model semacam ini akan menjadi metode ensembel yang rumit yang dapat menyebabkan prediksi yang baik tetapi kadang-kadang sulit atau tidak mungkin untuk dipahami.β0 β1
sumber
Di halaman 20 buku ini, penulis memberikan contoh yang indah yang membuat saya mengerti perbedaannya.
Inilah paragraf dari buku ini: Pengantar Pembelajaran Statistik
"Sebagai contoh , dalam pengaturan real estat, seseorang dapat berusaha untuk menghubungkan nilai-nilai rumah dengan input seperti tingkat kejahatan, zonasi, jarak dari sungai, kualitas udara, sekolah, tingkat pendapatan masyarakat, ukuran rumah, dan sebagainya. Dalam hal ini orang mungkin tertarik pada bagaimana variabel input individu mempengaruhi harga — yaitu, berapa banyak nilai tambahan rumah jika memiliki pemandangan sungai? Ini adalah masalah inferensi . Atau, orang mungkin hanya tertarik dalam memprediksi nilai sebuah rumah mengingat karakteristiknya: apakah rumah ini dinilai terlalu rendah atau lebih? Ini adalah masalah prediksi . "
sumber
Sekarang, jika Anda mendapatkan data tentang pendapatan, katakanlah seri pendapatan pribadi dari BEA, dan buat variabel waktu tahun, Anda dapat memperkirakan fungsi f , lalu masukkan nilai-nilai terbaru dari pendapatan populasi dan waktu tahun ke ini. fungsi. Ini akan menghasilkan prediksi untuk kuartal berikutnya dari pendapatan toko.
sumber
Bayangkan, Anda adalah seorang dokter di unit perawatan intensif. Anda memiliki pasien dengan demam yang kuat dan jumlah sel darah tertentu dan berat badan yang diberikan dan seratus data yang berbeda dan Anda ingin memprediksi, apakah ia akan bertahan hidup. Jika ya, dia akan menyembunyikan cerita tentang anak yang lain kepada istrinya, jika tidak, penting baginya untuk mengungkapkannya, selagi dia bisa.
Dokter dapat melakukan prediksi ini berdasarkan data dari mantan pasien yang ia miliki di unitnya. Berdasarkan pengetahuan perangkat lunaknya, ia dapat memprediksi menggunakan regresi linier umum (glm) atau melalui jaringan saraf (nn).
1. Model Linear Umum
Ada banyak parameter berkorelasi jauh untuk glm sehingga untuk mendapatkan hasil, dokter harus membuat asumsi (linearitas dll) dan keputusan tentang parameter mana yang cenderung memiliki pengaruh. Glm akan menghadiahinya dengan uji-t signifikansi untuk masing-masing parameternya sehingga ia dapat mengumpulkan bukti kuat, bahwa jenis kelamin dan demam memiliki pengaruh signifikan, berat badan belum tentu demikian.
2. Jaring saraf
Jaring saraf akan menelan dan mencerna semua informasi yang ada dalam sampel mantan pasien. Tidak akan peduli, apakah prediktor berkorelasi dan tidak akan mengungkapkan informasi sebanyak itu, tentang apakah pengaruh berat badan tampaknya hanya penting dalam sampel yang ada atau secara umum (setidaknya tidak pada tingkat keahlian yang dimiliki dokter). ditawarkan). Itu hanya akan menghitung hasilnya.
Apa yang lebih baik
Metode apa yang harus dipilih tergantung pada sudut dari mana Anda melihat masalah: Sebagai seorang pasien, saya lebih suka jaringan saraf yang menggunakan semua data yang tersedia untuk tebakan terbaik tentang apa yang akan terjadi pada saya tanpa asumsi yang kuat dan jelas salah seperti linearitas. Sebagai dokter, yang ingin menyajikan beberapa data dalam jurnal, ia membutuhkan nilai-p. Kedokteran sangat konservatif: mereka akan meminta nilai-p. Jadi dokter ingin melaporkan, bahwa dalam situasi seperti itu, gender memiliki pengaruh yang signifikan. Bagi pasien, itu tidak masalah, gunakan saja pengaruh apa pun yang kemungkinan besar sampel sarankan.
Dalam contoh ini, pasien menginginkan prediksi, sisi ilmuwan dari dokter menginginkan kesimpulan. Sebagian besar, ketika Anda ingin memahami suatu sistem, maka kesimpulannya bagus. Jika Anda perlu membuat keputusan di mana Anda tidak dapat memahami sistem, prediksi harus cukup.
sumber
Anda tidak sendirian di sini. Setelah membaca jawaban, saya tidak bingung lagi - bukan karena saya mengerti perbedaannya, tetapi karena saya mengerti itu ada di mata yang melihatnya dan diinduksi secara verbal. Saya yakin sekarang kedua istilah itu adalah definisi politik daripada definisi ilmiah. Ambil contoh penjelasan dari buku, yang coba digunakan perguruan tinggi sebagai yang bagus: "berapa banyak nilai tambahan sebuah rumah jika memiliki pemandangan sungai? Ini masalah inferensi." Dari sudut pandang saya, ini benar-benar masalah prediksi. Anda adalah pemilik perusahaan konstruksi sipil, dan Anda ingin memilih tanah terbaik untuk membangun set rumah berikutnya. Anda harus memilih antara dua lokasi di kota yang sama, satu di dekat sungai, berikutnya di dekat stasiun kereta. Anda ingin memprediksiharga untuk kedua lokasi. Atau Anda ingin menyimpulkan . Anda akan menerapkan metode statistik yang tepat, tetapi Anda menyebutkan prosesnya. :)
sumber
Ada penelitian bagus yang menunjukkan bahwa prediktor kuat apakah peminjam akan membayar kembali pinjaman mereka adalah apakah mereka menggunakan kain merasa untuk melindungi lantai mereka agar tidak tergores oleh kaki furnitur. Variabel "felt" ini akan menjadi bantuan yang berbeda untuk model prediksi di mana hasilnya dibayar vs default. Namun, jika pemberi pinjaman ingin mendapatkan pengaruh yang lebih besar atas hasil ini, mereka akan lalai dalam berpikir bahwa mereka dapat melakukannya dengan mendistribusikan perasaan seluas mungkin.
"Seberapa besar kemungkinan peminjam ini membayar?" adalah masalah prediksi; "Bagaimana saya bisa memengaruhi hasilnya?" adalah masalah inferensi kausal.
sumber
y = f (x) lalu
prediksi (berapa nilai Y dengan nilai x yang diberikan: jika nilai spesifik x apa yang bisa menjadi nilai Y
inference (bagaimana y berubah dengan perubahan x): apa yang bisa menjadi pengaruhnya pada Y jika x berubah
Contoh prediksi: misalkan y merupakan gaji seseorang maka jika kita memberikan input seperti pengalaman bertahun-tahun, gelar sebagai variabel input maka fungsi kita memprediksi gaji karyawan.
Contoh kesimpulan: anggap biaya perubahan hidup lalu berapa perubahan gaji
sumber