Seorang instruktur di universitas saya mengajukan pertanyaan seperti ini (bukan untuk pekerjaan rumah karena kelas sudah selesai dan saya tidak ada di dalamnya). Saya tidak tahu bagaimana cara mendekatinya.
Pertanyaannya menyangkut 2 kantong masing-masing berisi bermacam-macam buah yang berbeda:
Kantong pertama berisi buah yang dipilih secara acak berikut:
+ ------------- + -------- + --------- + | diameter cm | massa g | busuk? | + ------------- + -------- + --------- + | 17.28 | 139.08 | 0 | | 6.57 | 91.48 | 1 | | 7.12 | 74.23 | 1 | | 16.52 | 129.8 | 0 | | 14.58 | 169.22 | 0 | | 6,99 | 123.43 | 0 | | 6.63 | 104,93 | 1 | | 6,75 | 103.27 | 1 | | 15.38 | 169.01 | 1 | | 7.45 | 83.29 | 1 | | 13.06 | 157.57 | 0 | | 6.61 | 117.72 | 0 | | 7.19 | 128.63 | 0 | + ------------- + -------- + --------- +
Kantung kedua berisi 6 buah yang dipilih secara acak dari toko yang sama dengan kantong pertama. Jumlah diameternya adalah 64,2 cm dan 4 busuk.
Berikan perkiraan untuk massa kantung kedua.
Saya dapat melihat bahwa ada dua jenis buah yang berbeda dengan diameter dan massa yang terdistribusi normal, tetapi saya bingung bagaimana melanjutkannya.
regression
estimation
rutilusk
sumber
sumber
Jawaban:
Mari kita mulai dengan memplot data dan melihatnya. Ini adalah jumlah data yang sangat terbatas, jadi ini akan menjadi ad hoc dengan banyak asumsi.
Jadi ini datanya, titik merah mewakili buah busuk:
Anda benar dalam mengasumsikan bahwa ada dua jenis buah. Asumsi yang saya buat adalah sebagai berikut:
Karena diberikan bahwa jumlah diameter adalah 64,2 cm, maka kemungkinan besar dua buah besar dan empat kecil. Sekarang ada 3 kasing untuk berat. Ada 2, 3 atau 4 buah kecil busuk, ( buah besar yang busuk tidak mempengaruhi massa dengan asumsi ). Jadi sekarang Anda bisa mendapatkan batasan pada massa Anda dengan menghitung nilai-nilai ini.
Kami secara empiris dapat memperkirakan probabilitas jumlah buah kecil yang busuk. Kami menggunakan probabilitas untuk menimbang estimasi massa kami, tergantung pada jumlah buah busuk:
Memberi kami perkiraan final 691.5183g . Saya pikir Anda harus membuat sebagian besar asumsi yang saya buat untuk mencapai kesimpulan, tetapi saya pikir mungkin untuk melakukan ini dengan cara yang lebih cerdas. Saya juga mencicipi secara empiris untuk mendapatkan kemungkinan jumlah buah kecil busuk, itu hanya kemalasan dan dapat dilakukan "secara analitik".
sumber
Saya akan mengusulkan pendekatan berikut:
Semua ini dapat dikelola dengan skrip sederhana.
sumber
Berbagai pendekatan termasuk, dari yang paling sederhana sampai yang kompleks,
. . .
metode kombinatorik
Pendekatan-pendekatan tersebut disusun berdasarkan kesederhanaan perhitungan, bukan agar pendekatan apa pun menjadi lebih baik, atau tidak ada gunanya sama sekali. Pemilihan pendekatan mana yang akan digunakan tergantung pada karakteristik populasi yang diketahui atau diasumsikan. Misalnya, jika massa buah-buahan dalam populasi toko terdistribusi normal dan tidak tergantung pada diameter dan status busuk, orang dapat menggunakan pendekatan pertama yang paling sederhana tanpa keuntungan apa pun (atau bahkan kerugian kesalahan pengambilan sampel dari banyak variabel) menggunakan pendekatan yang lebih kompleks . Jika tidak independen variabel terdistribusi identik identik, maka pilihan yang lebih kompleks tergantung pada informasi yang diketahui atau diasumsikan tentang populasi mungkin lebih baik.
sumber