Berapa yang harus dibayar? Masalah praktis

66

Ini bukan pertanyaan pekerjaan rumah tetapi masalah nyata yang dihadapi oleh perusahaan kami.

Baru-baru ini (2 hari yang lalu) kami memesan untuk pembuatan 10.000 label produk ke dealer. Dealer adalah orang yang mandiri. Dia mendapatkan label yang diproduksi dari luar dan perusahaan melakukan pembayaran ke dealer. Setiap label harganya tepat $ 1 untuk perusahaan.

Kemarin, dealer datang dengan label tetapi label dibundel dalam paket masing-masing 100 label. Dengan cara ini ada total 100 paket dan setiap paket berisi 100 label, sehingga total 10.000 label. Sebelum melakukan pembayaran ke dealer sebesar $ 10.000, kami memutuskan untuk menghitung beberapa paket untuk memastikan bahwa setiap paket persis mengandung 100 label. Ketika kami menghitung label, kami menemukan paket kurang dari 100 label (kami menemukan 97 label). Untuk memastikan bahwa ini bukan kebetulan, tetapi telah dilakukan dengan sengaja, kami menghitung 5 paket lagi dan menemukan sejumlah label berikut di setiap paket (termasuk paket pertama):

Packet Number    Number of labels
1                97 
2                98  
3                96
4                100
5                95 
6                97  

Tidak mungkin untuk menghitung setiap paket, jadi kami memutuskan untuk melakukan pembayaran secara rata-rata. Jadi, jumlah rata-rata label dalam enam paket adalah 97,166, sehingga total pembayaran yang diputuskan adalah $ 9716.

Saya hanya ingin tahu bagaimana ahli statistik harus berurusan dengan jenis masalah seperti itu .
Lebih lanjut saya ingin tahu berapa yang harus kami bayar untuk mendapatkan jaminan 95% bahwa kami belum membayar lebih dari jumlah sebenarnya seluruh label.

Informasi tambahan:

P (paket apa pun yang berisi lebih dari 100 label) = 0
P (paket apa pun yang berisi label kurang dari 90) = 0 {label yang kurang dari 90 akan mudah dideteksi saat menghitung paket karena paket akan memiliki bobot lebih rendah}


EDIT: Dealer hanya menolak malpraktek tersebut. Kami menemukan dealer ini bekerja berdasarkan komisi tertentu yang mereka dapatkan dari pabrikan tentang apa yang dibayar oleh perusahaan. Ketika kami berkomunikasi langsung ke pabrikan, kami menemukan bahwa itu bukan kesalahan pabrikan atau dealer. Pabrikan berkata, "Label menjadi pendek karena ukuran lembar tidak terstandarisasi , dan berapa pun angka yang dipotong dari lembar tunggal, mereka membuatnya disatukan dalam satu paket".

Selanjutnya, kami mendapatkan validasi pernyataan pertama kami yang diberikan dalam informasi tambahan, karena pabrikan mengakui bahwa dari peningkatan marginal dalam ukuran lembaran, tidak mungkin untuk memotong label tambahan, juga, dari pengurangan marginal dalam ukuran sheet tidak mungkin untuk memotong 100 label dengan ukuran yang persis sama.

Neeraj
sumber
7
+1 (1) Bagaimana Anda bisa membenarkan pernyataan pertama di bagian "informasi tambahan"? (2) Seberapa akurat Anda menimbang paket?
whuber
15
Inggris dan Isaac Newton menghadapi masalah yang sama 300 tahun yang lalu. (Taruhannya agak lebih besar, karena "label" dalam pertanyaan yang dicetak koin.) Oleh karena itu Anda mungkin menikmati membaca akun Stephen Stigler tentang Pengadilan yang mengadakan percobaan di stat.wisc.edu/sites/default/files/TR442_0.pdf .
whuber
7
@Neeraj Jika bobot semua item konsisten, mengapa tidak hanya menimbang seluruh pengiriman?
Pasang kembali Monica
9
Tawarkan untuk membayar $ 9000 dan tunggu mereka mengatakan, "Tapi kami hanya mempersingkat Anda 600 bukan 1000"
Dean MacGregor
5
Selain dari pertanyaan statistik yang hebat, +1, saya ingin membagikan nasihat langsung dari bisnis percetakan selama bertahun-tahun: semua printer profesional yang layak memiliki kebijakan overrun / underrun seperti ini karena sebagian besar printer tidak menawarkan jumlah yang tepat pada apa pun yang tidak menggunakan "penomoran" (nomor seri individual). Tetapi mereka harus memiliki jumlah yang sangat baik dari apa yang mereka berikan kepada Anda, dan jika korsleting mendiskon Anda jika lebih dari kecil (5%, katakanlah). Mengisi harga penuh untuk underruns yang diketahui BUKAN kebijakan standar.
BrianH

Jawaban:

20

Saya akan tertarik pada umpan balik pada paragraf awal "Setelah refleksi ...", karena bagian tertentu dari model telah membuat saya terjaga di malam hari.

Model Bayesian

Pertanyaan yang direvisi membuat saya berpikir bahwa kita dapat mengembangkan model secara eksplisit, tanpa menggunakan simulasi. Simulasi memperkenalkan variabilitas tambahan karena keacakan sampel yang melekat. Jawaban para ahli sofologi sangat bagus.

Asumsi : jumlah terkecil label per amplop adalah 90, dan yang terbesar adalah 100.

Oleh karena itu, jumlah label terkecil yang mungkin adalah 9000 + 7 + 8 + 6 + 10 + 5 + 7 = 9043 (seperti yang diberikan oleh data OP), 9000 karena batas bawah kami, dan label tambahan berasal dari data yang diamati.

Menunjukkan jumlah label dalam amplop . Menunjukkan jumlah label lebih dari 90, yaitu , sehingga . The distribusi binomial model jumlah total keberhasilan (di sini sukses adalah adanya label dalam amplop) di uji coba ketika percobaan independen dengan sukses konstan probabilitas sehingga mengambil nilaiKami mengambil , yang memberikan 11 hasil yang berbeda. Saya berasumsi bahwa karena ukuran lembar tidak teratur, beberapa lembar hanya memiliki ruang untuk i X i X = Y - 90 X { 0 , 1 , 2 , . . . ,YiiXiX=Y90n p X 0 , 1 , 2 , 3 , . . . , n . n = 10 X p X iBinomial ( 10 , p ) .X{0,1,2,...,10}npX0,1,2,3,...,n.n=10Xlabel tambahan lebih dari 90, dan bahwa ini "ruang tambahan" untuk setiap label lebih dari 90 terjadi secara independen dengan probabilitas . JadipXiBinomial(10,p).

(Setelah refleksi, asumsi independensi / model binomial mungkin merupakan asumsi yang aneh untuk dibuat, karena secara efektif memperbaiki komposisi lembaran printer menjadi unimodal, dan data hanya dapat mengubah lokasi mode, tetapi model tidak akan pernah mengakui distribusi multimodal. Misalnya, di bawah model alternatif, mungkin saja printer itumemiliki lembar ukuran 97, 98, 96, 100 dan 95: ini memenuhi semua kendala yang dinyatakan dan data tidak mengecualikan kemungkinan ini. Mungkin lebih tepat untuk menganggap setiap ukuran lembar sebagai kategorinya sendiri dan kemudian memasukkan model Dirichlet-multinomial ke data. Saya tidak melakukan ini di sini karena datanya sangat langka, sehingga probabilitas posterior pada masing-masing dari 11 kategori akan sangat sangat dipengaruhi oleh sebelumnya. Di sisi lain, dengan mencocokkan model yang lebih sederhana, kita juga membatasi jenis kesimpulan yang dapat kita buat.)

Setiap amplop merupakan realisasi iid dari . Jumlah percobaan binomial dengan probabilitas keberhasilan yang sama juga binomial, jadi(Ini adalah teorema - untuk memverifikasi, gunakan teorema keunikan MGF.)iXpiXiBinomial(60,p).

Saya lebih suka memikirkan masalah ini dalam mode Bayesian, karena Anda dapat membuat pernyataan probabilitas langsung tentang jumlah posterior yang diminati. Sebelum percobaan binomial dengan tidak diketahui adalah distribusi beta , yang sangat fleksibel (bervariasi antara 0 dan 1, dapat simetris atau asimetris di kedua arah, seragam atau salah satu dari dua massa Dirac, memiliki antimode atau mode .. Ini alat yang luar biasa!). Dengan tidak adanya data, masuk akal untuk mengasumsikan probabilitas yang seragam di atas . Artinya, orang mungkin berharap melihat satu lembar menampung 90 label sesering 91, sesering 92, ..., sesering 100. Jadi, yang sebelumnya adalahpppBeta(1,1).Jika Anda merasa beta ini tidak masuk akal, seragam sebelumnya dapat diganti dengan beta lain sebelumnya, dan perhitungannya bahkan tidak akan bertambah sulit!

Distribusi posterior pada adalah oleh sifat konjugasi model ini. Ini hanya langkah menengah, meskipun, karena kita tidak peduli tentang sebanyak yang kita peduli tentang jumlah total label. Sayangnya, sifat konjugasi juga berarti bahwa distribusi prediksi posterior lembaran adalah beta-binomial , dengan parameter beta posterior. Ada reamining "percobaan", yaitu label yang kehadirannya dalam pengiriman tidak pasti, sehingga model posterior kami pada label yang tersisa adalahppBeta(1+43,1+17)p940ZZBB(44,18,940).

masukkan deskripsi gambar di sini

Karena kami memiliki distribusi pada dan model nilai per label (vendor menyetujui satu dolar per label), kami juga dapat menyimpulkan distribusi probabilitas di atas nilai lot. Nyatakan nilai total dolar dari lot. Kita tahu bahwa , karena hanya memodelkan label yang tidak pasti. Jadi distribusi atas nilai diberikan oleh .ZDD=9043+ZZD

Apa cara yang tepat untuk mempertimbangkan penetapan harga lot?

Kita dapat menemukan bahwa kuantil pada 0,025 dan 0,975 (interval 95%) masing-masing adalah 553 dan 769. Jadi interval 95% pada D adalah . Pembayaran Anda termasuk dalam interval itu. (Distribusi pada tidak persis simetris, jadi ini bukan interval pusat 95% - namun, asimetri dapat diabaikan. Lagi pula, seperti yang saya jelaskan di bawah ini, saya tidak yakin bahwa interval pusat 95% bahkan benar. satu untuk dipertimbangkan!)D[9596,9812]D

Saya tidak mengetahui fungsi kuantil untuk distribusi beta binomial di R, jadi saya menulis sendiri menggunakan R's root-finding.

qbetabinom.ab <- function(p, size, shape1, shape2){
    tmpFn <- function(x) pbetabinom.ab(x, size=size, shape1=shape1, shape2=shape2)-p
    q <- uniroot(f=tmpFn, interval=c(0,size))
    return(q$root)
}

Cara lain untuk memikirkannya adalah dengan memikirkan ekspektasinya. Jika Anda mengulangi proses ini berkali-kali, berapa biaya rata-rata yang akan Anda bayar? Kita bisa menghitung ekspektasi secara langsung. Model beta binomial memiliki ekspektasi , jadi hampir persis seperti yang Anda bayarkan. Kerugian Anda yang diharapkan pada kesepakatan hanya 6 dolar! Semua dikatakan, dilakukan dengan baik!E ( D ) = E ( 9043 + Z ) = E ( Z ) + 9043. E ( Z ) = n αDE(D)=E(9043+Z)=E(Z)+9043.E(D)=9710.097,E(Z)=nαα+β=667.0968E(D)=9710.097,

Tapi saya tidak yakin salah satu dari angka-angka ini adalah yang paling relevan. Lagi pula, vendor ini mencoba menipu Anda! Jika saya melakukan transaksi ini, saya akan berhenti mengkhawatirkan tentang impas atau harga nilai wajar lot dan mulai menghitung kemungkinan bahwa saya membayar lebih! Penjual jelas-jelas berusaha menipu saya, jadi saya berhak sepenuhnya untuk meminimalkan kerugian dan tidak mementingkan diri sendiri dengan titik impas. Dalam pengaturan ini, harga tertinggi yang akan saya tawarkan adalah 9615 dolar, karena ini adalah kuantil 5% dari posterior pada , yaitu ada kemungkinan 95% bahwa saya membayar kurangD . Penjual tidak dapat membuktikan kepada saya bahwa semua label ada di sana, jadi saya akan lindung nilai taruhan saya.

(Tentu saja, fakta bahwa vendor menerima kesepakatan memberi tahu kami bahwa ia memiliki kerugian nyata non-negatif ... Saya belum menemukan cara untuk menggunakan informasi itu untuk membantu kami menentukan lebih tepatnya berapa banyak Anda ditipu, kecuali untuk mencatat itu karena dia menerima tawaran itu, kamu paling tidak mencapai titik impas.)

Perbandingan dengan bootstrap

Kami hanya memiliki 6 pengamatan untuk bekerja. Pembenaran untuk bootstrap adalah asimptotik, jadi mari kita lihat seperti apa hasilnya pada sampel kecil kami. Plot ini menunjukkan kepadatan simulasi boostrap. masukkan deskripsi gambar di sini

Pola "bergelombang" adalah artefak dari ukuran sampel kecil. Memasukkan atau mengecualikan salah satu poin akan memiliki efek dramatis pada rata-rata, menciptakan penampilan yang "padat" ini. Pendekatan Bayesian merapikan rumpun ini dan, menurut saya, adalah potret yang lebih bisa dipercaya tentang apa yang terjadi. Garis vertikal adalah kuantil 5%.

Pasang kembali Monica
sumber
itu adalah jawaban yang bagus. Anda memberikan wawasan baru dengan menghukum risiko. Terima kasih
Neeraj
1
Saya senang mengetahui bahwa kerugian yang Anda harapkan hanya $ 6. :-) Sekali lagi terima kasih atas pertanyaannya.
Pasang kembali Monica
1
np0,1,2,3,....,n.n=10Xp
Pasang kembali Monica
1
0,1,2,3,...101,102,103,...,1061060X10
1
Mari kita lanjutkan diskusi ini dalam obrolan .
Pasang kembali Monica
20

EDIT: Tragedi! Asumsi awal saya salah! (Atau ragu, setidaknya - apakah Anda memercayai apa yang penjual katakan kepada Anda? Tetap saja, berikan tip kepada Morten.) Yang saya kira merupakan pengantar statistik bagus yang lain, tetapi Pendekatan Partial Sheet kini ditambahkan di bawah ini ( karena orang-orang sepertinya menyukai Whole Sheet satu, dan mungkin seseorang masih akan merasa berguna)

Pertama-tama, masalah besar. Tapi saya ingin membuatnya sedikit lebih rumit.

Karena itu, sebelum saya melakukannya, izinkan saya membuatnya sedikit lebih sederhana, dan katakanlah - metode yang Anda gunakan saat ini sangat masuk akal . Murah, mudah, masuk akal. Jadi, jika Anda harus mematuhinya, Anda seharusnya tidak merasa buruk. Pastikan Anda memilih bundel Anda secara acak. DAN, jika Anda hanya bisa menimbang semuanya dengan andal (ujung topi ke whuber dan user777), maka Anda harus melakukan itu.

Alasan saya ingin membuatnya sedikit lebih rumit adalah karena Anda sudah memiliki - Anda belum memberi tahu kami tentang seluruh kerumitannya, yaitu bahwa - penghitungan membutuhkan waktu, dan waktu adalah uang juga . Tetapi berapa banyak ? Mungkin sebenarnya lebih murah untuk menghitung semuanya!

Jadi yang sebenarnya Anda lakukan adalah menyeimbangkan waktu yang diperlukan untuk menghitung, dengan jumlah uang yang Anda tabung. (JIKA, tentu saja, Anda hanya memainkan game ini sekali. BERIKUTNYA kali Anda memiliki ini terjadi dengan penjual, mereka mungkin telah tertangkap, dan mencoba trik baru. Dalam teori permainan, ini adalah perbedaan antara Permainan Tembakan Tunggal, dan Iterated Game. Tapi untuk sekarang, mari kita berpura-pura penjual akan selalu melakukan hal yang sama.)

Satu hal lagi sebelum saya sampai pada estimasi. (Dan, maaf telah menulis begitu banyak dan masih belum mendapatkan jawabannya, tapi kemudian, itu jawaban yang cukup bagus untuk Apa yang akan dilakukan ahli statistik? Mereka akan menghabiskan banyak waktu memastikan mereka memahami setiap bagian kecil dari masalah sebelum mereka merasa nyaman mengatakan apa-apa tentang itu.) Dan hal itu adalah wawasan berdasarkan hal berikut:

(EDIT: JIKA MEREKA AKAN BENAR-BENAR MENIPU ...) Penjual Anda tidak menghemat uang dengan menghapus label - mereka menghemat uang dengan tidak mencetak lembaran. Mereka tidak dapat menjual label Anda kepada orang lain (saya kira). Dan mungkin, saya tidak tahu dan saya tidak tahu jika Anda tahu, mereka tidak dapat mencetak setengah lembar barang Anda, dan setengah lembar milik orang lain. Dengan kata lain, bahkan sebelum Anda mulai menghitung, Anda dapat mengasumsikan bahwa total jumlah label adalah baik 9000, 9100, ... 9900, or 10,000. Begitulah cara saya akan mendekatinya, untuk saat ini.

Metode Lembar Utuh

Ketika masalah agak rumit seperti ini (diskrit, dan dibatasi), banyak ahli statistik akan mensimulasikan apa yang mungkin terjadi. Inilah yang saya disimulasikan:

# The number of sheets they used
sheets <- sample(90:100, 1)
# The base counts for the stacks
stacks <- rep(90, 100)
# The remaining labels are distributed randomly over the stacks
for(i in 1:((sheets-90)*100)){
    bucket <- sample(which(stacks!=100),1)
    stacks[bucket] <- stacks[bucket] + 1
}

Ini memberi Anda, dengan asumsi mereka menggunakan seluruh lembar, dan asumsi Anda benar, kemungkinan distribusi label Anda (dalam bahasa pemrograman R).

Lalu saya melakukan ini:

alpha = 0.05/2
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    print(round(quantile(s, probs=c(alpha, 1-alpha)), 3))
}

Ini menemukan, menggunakan metode "bootstrap", interval kepercayaan menggunakan 4, 5, ... 20 sampel. Dengan kata lain, Rata-rata, jika Anda menggunakan sampel N, seberapa besar interval kepercayaan diri Anda? Saya menggunakan ini untuk menemukan interval yang cukup kecil untuk memutuskan jumlah lembar, dan itulah jawaban saya.

Dengan "cukup kecil," Maksud saya interval kepercayaan 95% saya hanya memiliki satu bilangan bulat di dalamnya - misalnya jika interval kepercayaan saya adalah dari [93.1, 94.7], maka saya akan memilih 94 sebagai jumlah lembar yang benar, karena kita tahu ini nomor keseluruhan.

Kesulitan lain - kepercayaan diri Anda tergantung pada kebenaran . Jika Anda memiliki 90 lembar, dan setiap tumpukan memiliki 90 label, maka Anda menyatu sangat cepat. Sama dengan 100 lembar. Jadi saya melihat 95 lembar, di mana ada ketidakpastian terbesar, dan menemukan bahwa untuk memiliki kepastian 95%, Anda membutuhkan sekitar 15 sampel, rata-rata. Jadi katakanlah secara keseluruhan, Anda ingin mengambil 15 sampel, karena Anda tidak pernah tahu apa yang sebenarnya ada.

SETELAH Anda tahu berapa banyak sampel yang Anda butuhkan, Anda tahu bahwa penghematan yang Anda harapkan adalah:

100Nmissing15c

c50015

Tetapi Anda juga harus meminta bayaran kepada orang tersebut karena membuat Anda melakukan semua pekerjaan ini!

(EDIT: TAMBAH!) Pendekatan Lembar Sebagian

Oke, jadi mari kita asumsikan apa yang dikatakan pabrikan itu benar, dan itu tidak disengaja - beberapa label hilang di setiap lembar. Anda masih ingin tahu, Tentang berapa label, secara keseluruhan?

Masalah ini berbeda karena Anda tidak lagi memiliki keputusan bersih yang bagus yang dapat Anda buat - itu merupakan keuntungan bagi asumsi Whole Sheet. Sebelumnya, hanya ada 11 jawaban yang mungkin - sekarang, ada 1100, dan mendapatkan interval kepercayaan 95% pada persis berapa banyak label yang ada mungkin akan mengambil sampel lebih banyak daripada yang Anda inginkan. Jadi, mari kita lihat apakah kita dapat memikirkan hal ini secara berbeda.

Karena ini benar-benar tentang Anda membuat keputusan, kami masih kehilangan beberapa parameter - berapa banyak uang yang ingin Anda hilangkan, dalam satu kesepakatan, dan berapa banyak uang yang dibutuhkan untuk menghitung satu tumpukan. Tetapi izinkan saya mengatur apa yang dapat Anda lakukan, dengan angka-angka itu.

Simulasi lagi (walaupun props ke user777 jika Anda bisa melakukannya tanpa!), Sangat informatif untuk melihat ukuran interval ketika menggunakan jumlah sampel yang berbeda. Itu bisa dilakukan seperti ini:

stacks <- 90 + round(10*runif(100))
q <- array(dim=c(17,2))
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    q[i-3,] <- quantile(s, probs=c(.025, .975))
}
plot(q[,1], ylim=c(90,100))
points(q[,2])

Yang mengasumsikan (saat ini) bahwa setiap tumpukan memiliki jumlah label acak yang seragam antara 90 dan 100, dan memberi Anda:

Batas pada Interval Keyakinan Berdasarkan Jumlah Sampel

Tentu saja, jika semuanya benar-benar seperti mereka telah disimulasikan, rata-rata sebenarnya adalah sekitar 95 sampel per tumpukan, yang lebih rendah dari apa yang tampaknya kebenaran - ini adalah salah satu argumen sebenarnya untuk pendekatan Bayesian. Tapi, itu memberi Anda perasaan yang berguna tentang seberapa jauh Anda menjadi lebih yakin tentang jawaban Anda, saat Anda terus mengambil sampel - dan sekarang Anda dapat secara eksplisit menukar biaya pengambilan sampel dengan kesepakatan apa pun yang Anda lakukan tentang penetapan harga.

Yang saya tahu sekarang, kita semua benar-benar ingin tahu.

one_observation
sumber
6
+1 Analisis ini secara langsung dan kreatif menjawab pertanyaan: bagaimana seorang ahli statistik (baik) akan memikirkan masalah ini? Berfokus pada jumlah lembar adalah wawasan yang berharga.
whuber
1
Pendekatan biaya-manfaat adalah ide bagus. Sudah saya katakan bahwa orang kolektif * jam dari daya otak yang dikhususkan untuk masalah ini telah melampaui penghematan $ 284 dari n = 6 sampel yang digunakan Neeraj. :)
RobertF
1
Jawaban bagus. Seperti yang saat ini Anda kodekan, ketika printer mengambil setumpuk penuh ia hanya menjatuhkan label ekstra ke tanah, yang mungkin masuk akal. Tetapi jika Anda ingin memiliki 9000,9100...10000label total pada akhirnya Anda bisa mengganti logika if Anda dengan bucket <- sample(which(stacks!=100),1)dan kemudian selalu menambah tumpukan.
Adam C
1
Ah, perhatikan saja sendiri! Terima kasih atas tangkapannya. Jelas sebuah kesalahan.
one_observation
1
Bagaimana Anda menghitung interval kepercayaan? Menggunakan bootstrap?
RobertF
3

Ini adalah sampel yang cukup terbatas. (Cuplikan kode ada di R)

> sample <- c(97,98,96,100,95,97)

Untuk perkiraan awal pada angka yang diharapkan dalam total populasi dan nilai kepercayaan 95% untuk harga, kita bisa mulai dengan mean dan 5% kuantil

> 100*mean(sample)
[1] 9716.667
> 100*quantile(sample,0.05)
  5% 
9525 

Untuk melangkah lebih jauh, kita harus membuat model teoretis dan membuat asumsi tambahan. Ada beberapa sumber ketidakpastian yang berperan - (1) ketidakpastian untuk bentuk fungsional dari model pengisian paket, (2) ketidakpastian dalam memperkirakan parameter untuk model, dan (3) kesalahan pengambilan sampel.

pn=100p

> n <- 100
> (p<-1-mean(sample)/100)
[1] 0.02833333

n100np10

> (lambda <- n*p)
[1] 2.833333

λ=lambda

> var(sample)
[1] 2.966667

λr=100*lambda

> 100*100-100*lambda
[1] 9716.667
> 100*100-qpois(0.95,100*lambda)
[1] 9689

ppαβαβα=1β=0

α=1+583β=0+17

αβαβ

Sekarang, dengan asumsi setiap paket diisi secara independen, kita dapat melihat seluruh kotak paket sebagai 10.000 peristiwa independen dan bukan 100 peristiwa dari 100 sub-aktivitas. Karena itu rata-rata adalah 9717.138 dengan standar deviasi 69,57153. Menggunakan fungsi distribusi, Anda dapat menghitung angka kepercayaan 95% menjadi sekitar 9593. Saya telah menggunakan paket R VGAMuntuk *betabinom.abfungsinya dalam melakukannya.

Jadi, ketidakpastian dalam parameter yang diperkirakan mengurangi harga kepercayaan 95% hingga hampir 100, dan kami berakhir cukup dekat dengan perkiraan sederhana awal kami.

Apa pun pendekatan atau modelnya, data tambahan dapat digunakan untuk memvalidasi model, yaitu melihat data tambahan masuk akal di bawah model teoretis atau apakah penyesuaian atau model baru diperlukan. Proses pemodelan mirip dengan metode ilmiah.

A. Webb
sumber
2

Dalam keadaan darurat, kecenderungan pertama saya adalah menghitung interval kepercayaan 95% untuk rata-rata sampel Anda di atas distribusi normal terpotong yang jatuh di antara batas bawah dan atas label 90 dan 100.

Paket R truncnormmemungkinkan Anda untuk menemukan interval kepercayaan untuk distribusi normal terpotong yang diberikan rata-rata sampel yang ditentukan, sampel standar deviasi, batas bawah, dan batas atas.

Karena Anda mengambil sampel n = 5 dari populasi yang relatif kecil (N = 100), Anda mungkin ingin melipatgandakan standar deviasi sampel Anda dengan faktor populasi terbatas = [(Nn) / (N-1)] ^. 5 = 0,98.

RobertF
sumber
5
Saya bertanya-tanya apakah komplikasi tambahan dengan mengasumsikan Normal terpotong bermanfaat - atau bahkan valid - mengingat bahwa penghitungannya terpisah dan hanya dapat mengambil sejumlah kecil nilai yang mungkin.
whuber
@whuber - Benar, tetapi interval kepercayaan melebihi distribusi mean sampel, yang merupakan kuantitas kontinu. Daripada menggunakan interval kepercayaan 95%, mungkin pilihan yang lebih baik adalah menemukan area di bawah distribusi antara jumlah diskrit, katakan 93 dan 99.
RobertF
Anda tidak perlu Normal terpotong untuk bekerja dengan mean sampel. Sepertinya komplikasi yang tidak perlu.
whuber
1
CLT tidak menyatakan bahwa apa pun akan mengikuti distribusi normal terpotong. Bootstrap cenderung bermasalah karena mengandalkan hasil asimptotik untuk validitasnya.
Whuber
1
Karena deviasi standar rata-rata dengan cepat menjadi jauh lebih kecil daripada kisaran, pemotongan praktis tidak relevan. Kita berbicara tentang solusi praktis yang tidak terlalu rumit dengan detail yang tidak perlu dan mungkin mengganggu.
whuber
2

Pendekatan yang cepat dan sederhana adalah dengan mempertimbangkan semua kemungkinan sampel ukuran 6. Hanya ada 15.625 permutasi. Melihat ini dan mengambil rata-rata untuk setiap kasus, dan kemudian menyortir rata-rata dan mengekstraksi 5% kuantil, kita mendapatkan nilai 96.

Jadi perkiraan jumlah yang harus Anda bayarkan adalah sekitar 9600. Ini adalah kesepakatan yang baik dengan beberapa pendekatan yang lebih canggih.

Perbaikan di sini adalah untuk mensimulasikan sejumlah besar sampel ukuran 6 dan menggunakan prosedur yang sama untuk menemukan persentil ke-5 dari rata-rata sampel. Dengan menggunakan sedikit lebih dari satu juta contoh, saya menemukan persentil ke-5 menjadi 96,1667, sehingga untuk dolar terdekat pembayarannya akan menjadi 9617 dolar, yang hanya selisih 2 dolar dari hasil user777 di 9615.

soakley
sumber
1
Bisakah Anda menjelaskan mengapa ini adalah jawaban yang cocok untuk berapa banyak yang harus dibayar? Mengapa tidak menggunakan mean sampel, misalnya?
whuber
Anda akan menggunakan mean sampel jika Anda ingin memiliki pembayaran yang sesuai dengan jumlah label yang menurut Anda ada. Tetapi si penanya meminta jaminan 95% bahwa ia tidak membayar lebih banyak label daripada yang dibuat. Jadi kita mendapatkan ide distribusi mean sampel untuk sampel ukuran 6 dan menggunakan persentil ke-5.
soakley
1
Akan baik untuk memasukkan penjelasan itu dalam jawaban Anda. Anda dapat mempertimbangkan juga menjelaskan mengapa menurut Anda prosedur resampling ini benar-benar menghasilkan batas kepercayaan yang valid atau dapat diandalkan. Meskipun dapat melakukannya dengan banyak dataset besar, kita harus mempertimbangkan apakah itu dapat digunakan dengan cara yang sama dengan dataset kecil.
whuber
0

Sepertinya Anda telah menyimpulkan bahwa kesalahan itu dilakukan dengan sengaja, tetapi seorang ahli statistik tidak akan langsung mengambil kesimpulan seperti itu (meskipun bukti tampaknya mendukung hal ini).

Seseorang dapat mengatur ini sebagai tes hipotesis:

H0: Dealer itu jujur ​​tapi cukup ceroboh

H1: Dealer itu curang, dan kekurangannya disengaja.

Mari kita asumsikan H0, maka setiap deviasi adalah peristiwa acak dengan mean = 0 dan kesempatan yang sama untuk menjadi positif atau negatif. Lebih jauh kita asumsikan bahwa penyimpangan terdistribusi secara normal. Simpangan baku untuk distribusi normal berdasarkan simpangan pada 6 titik data adalah sd = 1.722

Jika ahli statistik tidak mengingat teorinya dengan sangat baik, tetapi memiliki R di dekatnya (bukan skenario yang tidak mungkin) maka dia dapat menulis kode berikut untuk memeriksa kemungkinan tidak menerima penyimpangan positif (tidak ada paket lebih dari 100) jika H0 adalah benar.

numpackages=c(97,98,96,100,95,97)
error<-100-numpackages
errorStdev<-sd(error)
numSimulations<-1000000
max100orLes<-0
for(p in 1:numSimulations)
{
  simulatedError<-rnorm(6,mean=0,sd=errorStdev)

  packageDeviations<-round(simulatedError)

  maxValue<-max(packageDeviations)
  if(maxValue<=0)
  {
    max100orLes<-max100orLes+1
  }   
}
probH0<-100*max100orLes/numSimulations
cat("The probability the H0 is correct is:",probH0,"%")

Hasil simulasi adalah:

The probability the H0 is correct is: 5.3471 %

Kemungkinan dealer menjadi Jujur hanya 5,35%, dan karena itu sangat mungkin bahwa Anda telah menjadi korban penipuan.

Karena Anda mengatakan bahwa ini bukan pertanyaan pekerjaan rumah, tetapi situasi nyata bagi perusahaan Anda, maka ini tidak lagi menjadi latihan dalam menghitung label nomor yang diharapkan yang benar, tetapi sebaliknya merupakan kasus rumit tentang bagaimana menangani pemasok yang tidak jujur.

Apa yang Anda lakukan dari sini, benar-benar tidak dapat dijawab dengan statistik saja. Ini sangat tergantung pada leverage dan hubungan Anda dengan dealer.

Semoga berhasil !

Morten Bunes Gustavsen

Morten Bunes Gustavsen
sumber
1
17/61.72/60.7017/6/0.704.01000.00003
kegagalan selalu merupakan pilihan, jadi saya mungkin telah membuat kesalahan ... perhitungan saya didokumentasikan dalam kode R yang saya berikan, jadi seharusnya tidak ada alasan untuk bertanya-tanya bagaimana saya mendapatkan hasil saya. Ya Hipotesis H0 dalam kasus saya adalah bahwa dealer jujur, dan kemudian penyimpangan akan menjadi fluktuasi acak dengan rata-rata pada 100. Stdev dalam perhitungan saya hanyalah Stdev dari seri (-3, -2, -4, 0, -5, -3) yang merupakan penyimpangan dari 100 dalam setiap paket.
Morten Bunes Gustavsen
Saya benar-benar hanya menggunakan deviasi normal ini, dan menggambar 6 sampel, dan memeriksa apakah tidak ada yang lebih besar dari 0. Saya menjalankan simulasi 1.000.000 kali, dan menghitung berapa kali saya sangat beruntung tidak mendapatkan sampel di atas 0. Ini ternyata menjadi 5,35% dari kasus. Alasan saya memilih sudut ini adalah karena pertanyaan tersebut secara eksplisit menyatakan bahwa ini adalah situasi nyata (yaitu bukan latihan akademis), dan bahwa ia ingin mengetahui apa yang akan dilakukan oleh ahli statistik dalam kasus ini.
Morten Bunes Gustavsen
3
Pertanyaan itu juga menyatakan tidak ada peluang untuk menghitung lebih dari 100 label dalam satu paket. Apa pun yang Anda lakukan adalah simulasi angka yang mirip data - tetapi apa, jika ada, yang ada hubungannya dengan pertanyaan ("berapa yang harus kami bayar") tidak jelas.
whuber
-2

Bagaimana dengan sesuatu seperti model multinomial.

Prob untuk setiap hasil diperkirakan 1/6, 1/6, .... (berdasarkan 6 pengamatan) dan E (x) = 97,16 dan Var (x) = jumlah (95 ^ 2 * 1/6 + ...) - E (x) ^ 2 = 2.47 sehingga CI 95% akan menjadi [94, 100]

Xing
sumber
3
Ini tampaknya tidak multinomial sama sekali: CI Anda tampaknya menjadi interval teori-normal menggunakan rumus yang tidak dikoreksi untuk varian. Selain itu, bagaimana cara menjawab pertanyaan tentang berapa yang harus dibayar?
whuber
multinomial berlaku pada hasil, yaitu 95, 96, 97 ... 100 dan ya CI adalah teori normal karena xe (x) / sd ~ N. berapa banyak yang harus dibayar akan sama dengan harapan sehingga 97,16 * 100
Xing
4
Apakah Anda memperhatikan bahwa Anda sama sekali tidak menggunakan asumsi multinomial? CI Anda terlalu pendek, seperti yang diamati WS Gosset pada tahun 1908. Tetapi jika Anda akan mendasarkan rekomendasi Anda hanya pada rata-rata sampel, mengapa menghitung CI?
whuber