Saya memiliki data tentang serangkaian taruhan menang dan kalah lebih dari 5 putaran taruhan dengan gesekan setelah setiap putaran. Saya menggunakan pohon keputusan seperti berikut untuk menampilkan data.
Node menuju bagian atas pohon adalah mereka yang memiliki taruhan yang menang, dan mereka yang berada di bagian bawah pohon mengalami penurunan taruhan. Saya ingin melihat (a) gesekan pada setiap node (b) perubahan ukuran taruhan rata-rata di setiap node. Saya melihat tingkat gesekan pada setiap simpul dari simpul sebelumnya, dan tingkat kelangsungan hidup (menggunakan jumlah orang yang diharapkan pada setiap simpul jika probabilitasnya adalah 50%). Misalnya, jika probabilitasnya adalah 50% pada setiap simpul, dari 1000 yang dimulai, kira-kira 500 orang harus berada di masing-masing simpul kedua, W dan L. Hipotesisnya adalah (a) tingkat gesekan lebih tinggi setelah kehilangan taruhan (b) ukuran taruhan rata-rata dikurangi setelah kalah dan meningkat setelah pemenang.
Saya hanya ingin melakukan ini dalam pengaturan univariat yang sangat sederhana terlebih dahulu. Bagaimana saya bisa melakukan uji-t untuk menunjukkan perubahan dalam ukuran taruhan rata-rata dari simpul WW ke simpul WWW secara statistik signifikan jika 50 orang keluar? Saya tidak yakin ini adalah pendekatan yang tepat: setiap taruhan berikutnya independen, tetapi orang-orang keluar setelah kalah, sehingga sampel tidak cocok. Jika itu hanya kasus dari kelas yang sama mengambil serangkaian ujian satu demi satu tanpa putus, saya akan mengerti bagaimana melakukan uji-t yang sesuai, tetapi saya pikir ini sedikit berbeda.
Bagaimana saya bisa melakukan ini? Juga, jika hasilnya miring oleh sejumlah kecil pelanggan, bagaimana saya bisa mengambil 5% teratas dan 5% terbawah? Hapus saja pelanggan dengan ukuran saham kumulatif tertinggi dari taruhan 1 - 3?
Saya memiliki data dari mana angka itu dihasilkan, jadi saya memiliki rata-rata, std, std error dll di setiap node.
sumber
Jawaban:
Tampaknya "jelas dengan melihat" bahwa pecundang lebih cenderung putus daripada pemenang.
Anda bisa mencoba satu set tabel kontingensi untuk menentukan apakah di atas signifikan secara statistik. Sebagai contoh, dari 450 pemenang dari taruhan pertama, 25 keluar dan 425 bertahan dan dari 550 yang kalah, 150 keluar dan 400 bertahan. Dll
sumber
Tanggapan ini mungkin akan sedikit keluar dari topik, tetapi saya akan mulai dengan apa yang ada di topik. Jika saya diminta secara khusus untuk menentukan apakah perubahan dalam ukuran rata-rata taruhan dari WW ke WWW adalah signifikan, saya akan mengabaikan orang-orang yang tidak mencapai kedua node ini. Jika tujuan analisis ini adalah untuk dapat membuat prediksi untuk perilaku masa depan, maka mekanisme persidangan, harus melakukannya dengan baik untuk meniru mekanisme perilaku di masa depan, bahkan jika permainan itu bukan permainan kebetulan. Apa gunanya mengukur bagaimana taruhan seseorang akan berubah dari WW ke WWW jika mereka bukan tipe orang yang beralih dari WW ke WWW.
Meski begitu, secara umum kami jelas tidak suka secara sistematis mengecualikan populasi tertentu. Jika saya diberi data ini saya akan fokus pada jenis analisis yang lebih bisa dilakukan. Terutama (terutama jika ini bukan permainan kebetulan) para pemain di simpul yang sama memiliki banyak kesamaan. Mereka memiliki urutan yang sama (W, L) dan tidak memiliki kiri. Menjawab pertanyaan di sepanjang baris "Apa efek dari kehilangan putaran pemberian pada ukuran taruhan dan gesekan," cukup bisa dilakukan sambil mengendalikan perilaku yang bergantung pada simpul, dalam bentuk model multi-level.
Saran terakhir adalah untuk fokus pada perbedaan level pemain dari putaran ke putaran. Taruhan rata-rata turun 5 sen setelah sedikit mungkin secara statistik tidak signifikan, sementara 90% dari taruhan pemain akan turun mungkin.
sumber