Mengapa 600 dari 1000 lebih meyakinkan dari 6 dari 10?

41

Lihatlah kutipan ini dari "Buku pegangan keterampilan belajar", Palgrave, 2012, oleh Stella Cottrell, halaman 155:

Persentase Perhatikan kapan persentase diberikan.
Misalkan, pernyataan di atas berbunyi:

60% orang lebih suka jeruk; 40% mengatakan mereka lebih suka apel.

Ini terlihat meyakinkan: Jumlah numerik diberikan. Tetapi apakah perbedaan antara 60% dan 40% signifikan ? Di sini kita perlu tahu berapa banyak orang yang ditanya. Jika 1000 orang ditanya tentang 600 jeruk yang disukai, jumlahnya akan meyakinkan. Namun, jika hanya 10 orang yang ditanya, 60% berarti 6 orang lebih suka jeruk. "60%" terdengar meyakinkan dengan cara yang "6 dari 10" tidak. Sebagai pembaca yang kritis, Anda harus mencari persentase yang digunakan untuk membuat data yang tidak mencukupi terlihat mengesankan.

Apa yang disebut karakteristik ini dalam statistik? Saya ingin membaca lebih lanjut tentang itu.

Juya
sumber
38
ukuran sampel penting
Aksakal
36
Saya memilih dua orang secara acak, mereka berdua laki-laki, dan karena itu saya menyimpulkan bahwa 100% orang Amerika adalah laki-laki. Meyakinkan?
Casey
2
Ini adalah prinsip "Jangan bandingkan apel dengan jeruk"
serigala
2
Untuk mendekati pertanyaan itu dari sudut yang berbeda, Anda dapat mempertimbangkan menggali literatur tentang efek pembingkaian. Namun, ini adalah contoh bias kognitif dan merupakan topik psikologis, bukan statistik.
Larx
2
Anda dapat membayangkan perbedaan 1 seberapa besar dampaknya terhadap perkiraan kuantitas. 7/10 lebih jauh relatif dari 6/10 dari 601/1000 dari 600/1000.
mathreadler

Jawaban:

54

Saya ingin mendaftar contoh intuitif lain.

Misalkan saya katakan, saya dapat memprediksi hasil dari setiap koin flip. Anda tidak percaya dan ingin menguji kemampuan saya.

Anda menguji 5 kali, dan saya benar semuanya. Apakah Anda percaya saya memiliki kemampuan khusus? Mungkin tidak. Karena saya bisa memperbaiki semuanya secara kebetulan. (Secara khusus, anggap koin itu koin yang adil, dan setiap percobaan independen, maka saya bisa mendapatkan semua hak dengan tanpa kekuatan super. Lihat tautan Shufflepants untuk lelucon tentang hal itu).0.550.03

Di sisi lain, jika Anda menguji saya dalam jumlah besar, maka sangat tidak mungkin saya bisa mendapatkannya secara kebetulan. Misalnya, jika Anda menguji kali, probabilitas saya untuk mendapatkan semuanya benar adalah 0,5 1000 .1000.51000


Konsep statistik disebut kekuatan statistik, dari Wikipeida

Kekuatan tes hipotesis biner adalah probabilitas bahwa tes tersebut dengan benar menolak hipotesis nol (H0) ketika hipotesis alternatif (H1) benar.

Kembali ke kekuatan super pada contoh flip koin, pada dasarnya Anda ingin menjalankan pengujian hipotesis.

  • Hipotesis nol (H0): Saya tidak memiliki kekuatan super
  • Hipotesis alternatif (H1): Saya memiliki kekuatan super

Sekarang seperti yang Anda lihat dalam contoh numerik (uji saya 5 kali vs uji saya 100 kali), kekuatan statistik telah dipengaruhi oleh ukuran sampel.

Lebih banyak untuk dibaca di sini . (lebih teknis dan berdasarkan uji-t).

Alat interaktif untuk memahami kekuatan statistik dapat ditemukan di sini . Catatan, kekuatan statistik berubah dengan ukuran sampel!

masukkan deskripsi gambar di sini

Haitao Du
sumber
24
Wajib XKCD
Shufflepants
5
Ini sebenarnya tidak menjawab pertanyaan. Pertanyaannya ada dua bagian: "Mengapa [itu] lebih meyakinkan ..." dan "Apa ciri khas ini dalam statistik?" Anda memberikan contoh yang bertanya kepada pembaca apakah mereka lebih yakin dengan contoh itu, tetapi Anda belum menjelaskan fenomena itu, atau berusaha untuk menjelaskan mengapa itu lebih meyakinkan (hanya mengandalkan alasan intuitif pembaca pada satu contoh tunggal). Selain itu, Anda belum menyentuh pertanyaan kedua: Jika Anda yakin fenomena ini tidak memiliki nama, maka nyatakan secara eksplisit.
Makyen
1
@ Mayken Itu jelas jawaban yang dicoba. Ini bukan jawaban terbesar dan itu bukan jawaban yang lengkap tetapi jawaban parsial atau sokratis bukan alasan untuk mengklaim itu bukan jawaban sama sekali. Pertanyaan harus mengajukan satu pertanyaan dan jika mereka mengajukan serangkaian pertanyaan saya pikir itu sangat masuk akal (jika kurang ideal) untuk hanya menjawab sebagian dari mereka. Jika Anda merasa itu adalah jawaban yang buruk , Anda tentu bebas untuk mengatasi masalah yang Anda lihat sebagai masalah. [Dalam hal ini saya pikir saya juga tidak menjawab pertanyaan kedua; Saya hanya membahas efeknya; tidak setiap fenomena akan memiliki nama eksplisit]
Glen_b
1
Saya merasa 100% adalah kasus khusus dan jawaban ini tidak mendukung intuisi saya bahwa 600/1000 lebih meyakinkan daripada 6/10. Bahkan jika kita menganggapnya bukan kasus khusus, ini pada dasarnya hanya menyatakan kembali masalah dengan persentase yang berbeda.
NotThatGuy
2
@ Yuya itu adalah alat berbasis web yang dibangun oleh seseorang. Anda dapat mencobanya di sini
Haitao Du
29

Pikirkan dalam hal proporsi. Katakanlah memilih jeruk itu sukses, sedangkan apel lebih suka gagal. Jadi, tingkat keberhasilan rata-rata Anda adalah keberhasilanμ=# of sucessesn

μ(1μ)n.155.0155

Ryan Honea
sumber
17

Konsep ini merupakan konsekuensi dari hukum jumlah besar . Dari Wikipedia ,

Menurut hukum, rata-rata hasil yang diperoleh dari sejumlah besar uji coba harus dekat dengan nilai yang diharapkan, dan akan cenderung menjadi lebih dekat karena lebih banyak uji coba dilakukan.

Hasil dari sampel kecil mungkin lebih jauh dari nilai yang diharapkan daripada dari sampel yang lebih besar. Jadi, seperti yang dinyatakan dalam pertanyaan, seseorang harus berhati-hati terhadap hasil yang dihitung dari sampel kecil. Idenya juga dijelaskan dengan cukup baik di video YouTube ini .

Evan Phibbs
sumber
5
Ada beberapa teorema terkenal yang dikenal dalam statistik sebagai "hukum jumlah besar," tetapi tidak satupun dari mereka membuat pernyataan yang terlihat seperti yang ada di pertanyaan. Jadi, bagaimana Anda membuat koneksi?
whuber
3
Dari wikipedia en.wikipedia.org/wiki/Law_of_large_numbers , "Menurut hukum, rata-rata hasil yang diperoleh dari sejumlah besar uji coba harus mendekati nilai yang diharapkan, dan akan cenderung menjadi lebih dekat karena lebih banyak uji coba yang dilakukan" . Hasil dari sampel kecil mungkin lebih jauh dari nilai yang diharapkan daripada dari sampel yang lebih besar. Jadi, seperti yang dinyatakan dalam pertanyaan, seseorang harus berhati-hati terhadap hasil yang dihitung dari sampel kecil.
Evan Phibbs
6
Itu penjelasan yang bagus, terima kasih. Meskipun Anda benar untuk menulis bahwa seseorang harus berhati-hati mengenai berapa banyak "percobaan dalam jumlah besar" yang perlu untuk dipercayai oleh hukum, aplikasinya secara intuitif baik. Saya ingin menyarankan bahwa penjelasan Anda termasuk dalam jawaban Anda, di mana itu akan lebih banyak dibaca dan dihargai, daripada dikubur dalam komentar. Jawaban hanya tautan (seperti tautan Anda ke Youtube) tanpa penjelasan tidak bertahan di sini.
whuber
6

Kami berada dalam situasi memperkirakan jumlah populasi dengan jumlah sampel. Dalam hal ini, kami menggunakan proporsi sampel untuk memperkirakan proporsi populasi, tetapi prinsipnya jauh lebih umum.

10101

Ketika kita mengambil sampel yang lebih besar dan lebih besar (menggunakan random sampling), mean sampel akan cenderung menyatu dengan rata-rata populasi. (Ini adalah hukum jumlah besar.)

Namun apa yang kita benar-benar ingin tahu adalah seberapa jauh kita mungkin (seperti mungkin diwakili oleh lebar interval kepercayaan untuk proporsi, atau dengan margin kesalahan, yang biasanya setengah dari lebar seperti itu) .

120

1n

Sebagai hasilnya, kami lebih yakin tentang keakuratan estimasi kami ketika sampel besar - jika kami mengulangi percobaan kami lagi, cara lain seperti itu akan dekat dengan yang sekarang - mereka mengelompok bersama semakin erat, karena (dalam hal ini) perkiraan kami tidak bias, mereka mengelompokkan bersama di sekitar nilai yang kami coba perkirakan. Rata-rata sampel tunggal menjadi semakin informatif tentang di mana rata-rata populasi mungkin.

Glen_b
sumber
4

Aturan praktis untuk "menghitung" statistik, seperti menghitung jumlah orang yang suka jeruk, atau menghitung jumlah "klik" di penghitung Geiger karena peluruhan radioaktif, adalah bahwa margin kesalahan untuk penghitungan kira-kira sama dengan kuadrat -root dari nilai hitungan yang diharapkan. Statistik penghitungan yang diketahui adalah statistik Poisson.

Root kuadrat dari 6 adalah 2,4-ish, jadi margin of error adalah sekitar 40% (2.4 / 6). Root kuadrat dari 600 adalah 24-ish, jadi margin of error adalah sekitar 4% (24/600). Itu sebabnya setelah menghitung 600 lebih signifikan daripada menghitung 6. Kesalahan relatif adalah sepersepuluh.

Saya sedikit ceroboh tentang definisi margin of error. Ini benar-benar nilai 1-sigma, dan bukan cut-off yang sulit, tetapi itu adalah kisaran di mana Anda berharap sebagian besar (68%) pengukuran berada. Jadi jika Anda mengharapkan 6 pemakan oranye, Anda akan mengharapkan serangkaian jajak pendapat untuk memberi Anda sebagian besar angka dalam kisaran 4 hingga 8, seperti 6,6,5,6,7,2,4,6,3,5,6, 6,7,6,10,8,6,5,6,6,9,3,7,8.

Mark Lakata
sumber
3

Saya tidak memiliki nama yang Anda cari, tetapi masalahnya bukan statistik. Secara psikologis, cara manusia memproses angka dalam otak kita memberikan bobot (otoritas) yang lebih besar pada angka yang lebih besar daripada yang terjadi pada angka yang lebih kecil karena besarnya (ukuran fisik) secara visual sama pentingnya dengan nilai yang representatif. Dengan demikian, 600/1000 tampak lebih kredibel daripada 6/10. Inilah sebabnya mengapa pembeli lebih suka melihat "Diskon 10%!" untuk nilai kurang dari 100 dan "Hemat $ 10!" untuk nilai di atas 100 (disebut "Aturan 100"). Ini tentang bagaimana otak kita bereaksi terhadap persepsi.

Pandangan yang menakjubkan tentang fenomena serupa ini didiskusikan oleh Nick Kolenda dalam risalah online-nya, " Sebuah Panduan Besar untuk Psikologi Harga ".

JBH
sumber
2
Meskipun jawaban lain tidak salah, saya tidak melihat mereka benar-benar menanggapi teks yang dikutip seperti ini. Teks ini membahas dampak penyajian angka dan akurasi yang dirasakan, bukan jika angka sebenarnya lebih akurat. Artinya, Anda dapat membuat seseorang memahami bahwa informasi Anda lebih signifikan dengan mengatakan 600 dari 1000 atau 60% atau Anda dapat menyebabkannya tampak kurang signifikan dengan mengatakan 6 dari 10 walaupun masing-masing memiliki arti yang sama dengan menyiratkan sampel yang lebih kecil. Ukuran tanpa jika benar-benar dinyatakan, atau bahkan mungkin benar.
dlb
1
Contoh ini tampaknya secara mendasar cacat menurut pendapat saya. Misalnya pembelian 100 mendapat diskon% 10 untuk total 90 sedangkan pembelian 100,01 mendapat diskon 25 untuk total 75,01 yang hasilnya adalah harga yang sangat berbeda. Bahkan ada perbedaan dalam nilai sampai Anda mendapatkan hingga 250,05 (atau 250,10 tergantung pada pembulatan atau pemotongan). Pertanyaannya adalah berbicara tentang ukuran sampel dan kesalahan standar sementara contoh Anda lebih tentang perbedaan yang sebenarnya karena persepsi kami.
Joe W
@ Jo W, sementara saya tidak bisa berbicara dengan spesifikasi "aturan 100" (bukan menjadi psikolog), intinya jawaban saya adalah bahwa psikolog telah menentukan bahwa orang mempercayai jumlah yang lebih besar, bukan karena semakin besar ukuran sampel yang diwakilinya, tetapi karena persepsi pentingnya yang lebih besar diberikan kepada jumlah yang lebih besar. Sebagai seorang insinyur, saya lebih suka tidak seperti ini --- tapi itulah cara pikiran manusia bekerja. Jika Anda ingin menantang ini, saya sarankan membaca detail yang mendasari presentasi Pak Kolenda.
JBH
Anda melewatkan poin saya, ada perbedaan yang lebih besar dalam 10% sampai 100 dan 25 itu bukan hanya masalah persepsi. Fakta sederhananya adalah jika Anda mengambil kedua nilai pada 100 ada perbedaan 15% yang merupakan nilai yang jauh lebih mudah untuk diukur kemudian kesalahan standar ketika berbicara dua sampel yang berbeda satu dari 10 dan satu dari 1000.
Joe W
Saya mengubah pertanyaan saya untuk menggunakan 10% dan $ 10 untuk membantu Anda. Inti dari "aturan 100" adalah bahwa orang menganggap angka yang lebih besar memiliki relevansi yang lebih besar dan menganggap nilai moneter lebih penting daripada persentase belaka. Ini adalah masalah yang agak di luar ruang lingkup diskusi untuk tujuan OP.
JBH
3

Sementara margin of error yang sebenarnya adalah penting, alasan itu terdengar lebih meyakinkan adalah karena pengalaman yang lebih heuristik (aturan praktis) dengan orang-orang. Margin kesalahan aktual menegaskan heuristik ini pantas.

Jika sampel 6 untuk, dan 4 menentang, ini bisa menjadi 50/50 jika satu orang mengubah suara mereka, atau satu orang dicatat dalam kesalahan. Hanya ada dua orang lagi di sisi 6. Semua orang tahu dua serpihan, semua orang tahu sampel bisa dipilih: Anda hanya meminta pelayan dan tidak ada yang lain. Atau Anda hanya mengumpulkan 10 profesor perguruan tinggi di aula universitas. Atau Anda bertanya kepada 10 orang kaya di luar Saks Fifth Avenue.

Bahkan margin kesalahan matematika mengandaikan keacakan yang sebenarnya dan tidak memperhitungkan bias seleksi, atau bias seleksi sendiri, atau apa pun, orang secara intuitif dapat memahaminya.

Sebaliknya, hasil 600 vs 400 memiliki 200 lebih banyak orang di satu sisi daripada yang lain, dan 100 orang harus berubah pikiran. Angka-angka itu sangat sulit didapat (tetapi bukan tidak mungkin) oleh suatu kecelakaan di mana Anda memberikan suara, bagaimana Anda membuat orang setuju, bagaimana individu memahami atau menafsirkan pertanyaan, dll.

Ini lebih meyakinkan bukan karena bukti matematis yang seharusnya, tetapi karena kita tahu dari pengalaman bahwa kerumunan 1000 lebih cenderung beragam dalam pendapat mereka (pada apa pun) daripada kelompok 10. (kecuali Anda diam-diam melakukannya pemungutan suara Anda di konvensi partai politik atau rapat umum KKK atau yang lainnya akan menarik perhatian banyak pihak).

Matematika hanya secara tepat mengukur apa yang sudah kita ketahui dengan intuisi; bahwa lebih mudah untuk secara acak menemukan satu atau dua suara menyimpang dari 10, daripada secara acak menemukan 100 atau 200 suara menyimpang dari 1000.

Amadeus-Reinstate-Monica
sumber
3

Sesuatu yang belum disebutkan adalah untuk melihat masalah dari sudut pandang Bayesian.

pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

posterior dengan n_o = 6 dan n_a = 4

no=600na=400masukkan deskripsi gambar di sini

p=0.4p=0.8

Harap dicatat bahwa meskipun plot ini terlihat mirip dengan david25272, plot ini mewakili sesuatu yang sangat berbeda .

pno

nop

Luca Citi
sumber
2

Jawaban singkatnya:

Pada dasarnya itu lebih meyakinkan untuk memiliki 600 dari 1000 dari enam dari 10 karena, dengan preferensi yang sama itu jauh lebih mungkin untuk 6 dari 10 terjadi secara kebetulan.

Mari kita membuat asumsi - bahwa proporsi yang lebih suka jeruk dan apel sebenarnya sama (masing-masing, 50%). Sebut ini hipotesis nol. Dengan probabilitas yang sama ini, kemungkinan kedua hasil tersebut adalah:

  • Diberikan sampel 10 orang, ada peluang 38% untuk secara acak mendapatkan sampel 6 orang atau lebih yang lebih suka jeruk (yang bukan tidak mungkin).
  • Dengan sampel 1000 orang, ada kurang dari 1 dalam satu miliar peluang memiliki 600 atau lebih dari 1000 orang lebih suka jeruk.

(Untuk kesederhanaan saya mengasumsikan populasi yang tak terbatas dari mana untuk mengambil sampel dalam jumlah tak terbatas).


Derivasi sederhana

Salah satu cara untuk mendapatkan hasil ini adalah dengan hanya mendaftar cara-cara potensial di mana orang dapat menggabungkan dalam sampel kami:

Untuk sepuluh orang itu mudah:

Pertimbangkan untuk mengambil sampel 10 orang secara acak dari populasi orang tak terbatas dengan preferensi yang sama untuk apel atau jeruk. Dengan preferensi yang sama, mudah untuk mendaftar semua kombinasi potensial 10 orang:

Berikut daftar lengkapnya.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r adalah jumlah hasil (orang yang lebih suka jeruk), C adalah jumlah cara yang memungkinkan banyak orang lebih suka jeruk, dan p adalah probabilitas terpisah yang dihasilkan dari banyak orang lebih suka jeruk dalam sampel kami.

(p hanya C dibagi dengan jumlah total kombinasi. Perhatikan bahwa ada 1024 cara mengatur dua preferensi ini secara total (yaitu 2 pangkat 10).

  • Misalnya hanya ada satu cara (satu sampel) untuk 10 orang (r = 10) untuk semua lebih suka jeruk. Hal yang sama berlaku untuk semua orang yang lebih suka apel (r = 0).
  • Ada 10 kombinasi berbeda yang menghasilkan sembilan dari mereka lebih suka jeruk. (Satu orang berbeda lebih suka apel di setiap sampel).
  • Ada 45 sampel (kombinasi) di mana 2 orang lebih suka apel, dll, dll.

(Dalam kita bicara umum tentang n C r kombinasi dari hasil r dari sampel n orang. Ada kalkulator online dapat Anda gunakan untuk memverifikasi nomor ini.)

Daftar ini memungkinkan kami memberi kami probabilitas di atas menggunakan pembagian yang adil. Ada kemungkinan 21% untuk mendapatkan 6 orang dalam sampel yang lebih suka jeruk (210 dari 1024 kombinasi). Peluang mendapatkan enam orang atau lebih dalam sampel kami adalah 38% (jumlah semua sampel dengan enam orang atau lebih, atau 386 dari 1024 kombinasi).

Secara grafis, probabilitasnya terlihat seperti ini:

ukuran sampel binomial 10

Dengan jumlah yang lebih besar, jumlah kombinasi potensial tumbuh dengan cepat.

Untuk sampel hanya 20 orang ada 1.048.576 sampel yang mungkin, semua dengan kemungkinan yang sama. (Catatan: Saya hanya menunjukkan setiap kombinasi kedua di bawah).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

Masih ada satu sampel di mana semua 20 orang lebih suka jeruk. Kombinasi yang menampilkan hasil campuran jauh lebih mungkin, hanya karena ada banyak lagi cara orang-orang dalam sampel dapat digabungkan.

Sampel yang bias jauh lebih tidak mungkin, hanya karena ada lebih sedikit kombinasi orang yang dapat menghasilkan sampel tersebut:

Dengan hanya 20 orang di setiap sampel, probabilitas kumulatif untuk memiliki 60% atau lebih (12 atau lebih) orang dalam sampel kami lebih memilih jeruk turun menjadi hanya 25%.

Distribusi probabilitas dapat dilihat menjadi lebih tipis dan lebih tinggi:

ukuran sampel binomial 20

Dengan 1000 orang jumlahnya sangat besar

Kita dapat memperluas contoh di atas untuk sampel yang lebih besar (tetapi jumlahnya tumbuh terlalu cepat untuk layak untuk mendaftar semua kombinasi), sebagai gantinya saya telah menghitung probabilitas dalam R:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

Peluang kumulatif untuk memiliki 600 orang atau lebih dari 1000 orang lebih suka jeruk hanya 1,364232e-10.

Distribusi probabilitas sekarang jauh lebih terkonsentrasi di sekitar pusat:

[ukuran sampel binomial 1000 [3]

(Misalnya untuk menghitung probabilitas tepat 600 dari 1000 orang lebih memilih jeruk dalam penggunaan R dbinom(600, 1000, prob=0.5)yang sama dengan 4,633908e-11, dan probabilitas 600 atau lebih banyak orang 1-pbinom(599, 1000, prob=0.5), yang sama dengan 1,364232e-10 (kurang dari 1 dalam satu miliar).

david25272
sumber
1

Ini karena angka yang lebih tinggi memastikan akurasi yang lebih besar. Misalnya, jika Anda akan mengambil 1000 orang acak dari mana saja di planet ini dan 599 di antaranya adalah pria melawan 10 orang acak dengan 6 pria, yang pertama akan lebih akurat. Demikian pula, jika Anda mengasumsikan populasi 7 miliar dan menghitung jumlah laki-laki, Anda akan mendapatkan jumlah yang lebih tepat yang jelas akan lebih meyakinkan daripada hanya dengan 1000 orang.

Zee
sumber