Uji apakah orang-orang keluar atau mengurangi taruhan setelah kekalahan berulang

10

Saya memiliki data tentang serangkaian taruhan menang dan kalah lebih dari 5 putaran taruhan dengan gesekan setelah setiap putaran. Saya menggunakan pohon keputusan seperti berikut untuk menampilkan data.

masukkan deskripsi gambar di sini

Node menuju bagian atas pohon adalah mereka yang memiliki taruhan yang menang, dan mereka yang berada di bagian bawah pohon mengalami penurunan taruhan. Saya ingin melihat (a) gesekan pada setiap node (b) perubahan ukuran taruhan rata-rata di setiap node. Saya melihat tingkat gesekan pada setiap simpul dari simpul sebelumnya, dan tingkat kelangsungan hidup (menggunakan jumlah orang yang diharapkan pada setiap simpul jika probabilitasnya adalah 50%). Misalnya, jika probabilitasnya adalah 50% pada setiap simpul, dari 1000 yang dimulai, kira-kira 500 orang harus berada di masing-masing simpul kedua, W dan L. Hipotesisnya adalah (a) tingkat gesekan lebih tinggi setelah kehilangan taruhan (b) ukuran taruhan rata-rata dikurangi setelah kalah dan meningkat setelah pemenang.

Saya hanya ingin melakukan ini dalam pengaturan univariat yang sangat sederhana terlebih dahulu. Bagaimana saya bisa melakukan uji-t untuk menunjukkan perubahan dalam ukuran taruhan rata-rata dari simpul WW ke simpul WWW secara statistik signifikan jika 50 orang keluar? Saya tidak yakin ini adalah pendekatan yang tepat: setiap taruhan berikutnya independen, tetapi orang-orang keluar setelah kalah, sehingga sampel tidak cocok. Jika itu hanya kasus dari kelas yang sama mengambil serangkaian ujian satu demi satu tanpa putus, saya akan mengerti bagaimana melakukan uji-t yang sesuai, tetapi saya pikir ini sedikit berbeda.

Bagaimana saya bisa melakukan ini? Juga, jika hasilnya miring oleh sejumlah kecil pelanggan, bagaimana saya bisa mengambil 5% teratas dan 5% terbawah? Hapus saja pelanggan dengan ukuran saham kumulatif tertinggi dari taruhan 1 - 3?

Saya memiliki data dari mana angka itu dihasilkan, jadi saya memiliki rata-rata, std, std error dll di setiap node.

pengguna2146441
sumber
1
Baris yang seharusnya WL diberi label WW. Kesalahan menyebar ke bawah garis itu. Apakah yang Anda miliki hanyalah angka ini atau apakah Anda memiliki data dari mana angka itu dihasilkan?
John
Saya mencoba mencari tahu apakah mungkin untuk mengetahui dari mana gesekan terjadi. N adalah orang yang bertaruh tetapi bukan orang yang benar-benar sampai di sana. Misalnya, 450 go W tetapi kemudian apa yang keluar adalah 250 dan 180. Jadi, 20 hilang tetapi apakah yang menang atau kalah?
John
Saya punya data dari mana angka itu dihasilkan, ya. Sejak itu saya telah mengedit pohon untuk memperbaiki kesalahan yang Anda tunjukkan dan mengubah beberapa simpul akhir untuk mereplikasi jenis gesekan dalam dataset nyata. Anda benar bahwa gesekan itu tidak jelas saat ini. Saya akan mengedit pohon lagi selama beberapa menit ke depan untuk menampilkan sedikit lebih banyak data. Terima kasih.
user2146441

Jawaban:

1

Tampaknya "jelas dengan melihat" bahwa pecundang lebih cenderung putus daripada pemenang.

Anda bisa mencoba satu set tabel kontingensi untuk menentukan apakah di atas signifikan secara statistik. Sebagai contoh, dari 450 pemenang dari taruhan pertama, 25 keluar dan 425 bertahan dan dari 550 yang kalah, 150 keluar dan 400 bertahan. Dll

Emil Friedman
sumber
0

Tanggapan ini mungkin akan sedikit keluar dari topik, tetapi saya akan mulai dengan apa yang ada di topik. Jika saya diminta secara khusus untuk menentukan apakah perubahan dalam ukuran rata-rata taruhan dari WW ke WWW adalah signifikan, saya akan mengabaikan orang-orang yang tidak mencapai kedua node ini. Jika tujuan analisis ini adalah untuk dapat membuat prediksi untuk perilaku masa depan, maka mekanisme persidangan, harus melakukannya dengan baik untuk meniru mekanisme perilaku di masa depan, bahkan jika permainan itu bukan permainan kebetulan. Apa gunanya mengukur bagaimana taruhan seseorang akan berubah dari WW ke WWW jika mereka bukan tipe orang yang beralih dari WW ke WWW.

Meski begitu, secara umum kami jelas tidak suka secara sistematis mengecualikan populasi tertentu. Jika saya diberi data ini saya akan fokus pada jenis analisis yang lebih bisa dilakukan. Terutama (terutama jika ini bukan permainan kebetulan) para pemain di simpul yang sama memiliki banyak kesamaan. Mereka memiliki urutan yang sama (W, L) dan tidak memiliki kiri. Menjawab pertanyaan di sepanjang baris "Apa efek dari kehilangan putaran pemberian pada ukuran taruhan dan gesekan," cukup bisa dilakukan sambil mengendalikan perilaku yang bergantung pada simpul, dalam bentuk model multi-level.

Saran terakhir adalah untuk fokus pada perbedaan level pemain dari putaran ke putaran. Taruhan rata-rata turun 5 sen setelah sedikit mungkin secara statistik tidak signifikan, sementara 90% dari taruhan pemain akan turun mungkin.

jlimahaverford
sumber