Terinspirasi oleh " contoh nyata dari distribusi umum ", saya bertanya-tanya contoh pedagogis apa yang digunakan orang untuk menunjukkan kecondongan negatif? Ada banyak contoh "kanonik" dari distribusi simetris atau normal yang digunakan dalam pengajaran - bahkan jika yang seperti tinggi dan berat tidak bertahan lebih dekat dari pengamatan biologis! Tekanan darah mungkin mendekati normalitas. Saya suka kesalahan pengukuran astronomi - yang menarik secara historis, mereka secara intuitif tidak lebih cenderung berada di satu arah daripada yang lain, dengan kesalahan kecil lebih mungkin daripada besar.
Contoh pedagogis umum untuk kemiringan positif termasuk pendapatan orang; jarak tempuh pada mobil bekas untuk dijual; waktu reaksi dalam percobaan psikologi; harga-harga rumah; jumlah klaim kecelakaan oleh pelanggan asuransi; jumlah anak dalam keluarga. Kelayakan fisik mereka sering berasal dari terikat di bawah (biasanya dengan nol), dengan nilai-nilai rendah yang masuk akal, bahkan umum, namun sangat besar (kadang-kadang urutan besarnya lebih tinggi) nilai-nilai diketahui terjadi.
Untuk kemiringan negatif, saya merasa lebih sulit untuk memberikan contoh yang jelas dan jelas yang dapat dipahami oleh audiens yang lebih muda (siswa sekolah menengah), mungkin karena lebih sedikit distribusi kehidupan nyata yang memiliki batas atas yang jelas. Contoh tidak enak yang saya ajarkan di sekolah adalah "jumlah jari". Kebanyakan orang memiliki sepuluh, tetapi beberapa kehilangan satu atau lebih karena kecelakaan. Hasilnya adalah "99% orang memiliki jumlah jari yang lebih tinggi daripada rata-rata"! Polydactyly memperumit masalah ini, karena sepuluh bukanlah batas atas yang ketat; karena jari-jari yang hilang dan ekstra adalah peristiwa yang jarang terjadi, mungkin tidak jelas bagi siswa yang efeknya paling menonjol.
Saya biasanya menggunakan distribusi binomial dengan tinggi . Tetapi para siswa sering menemukan "jumlah komponen yang memuaskan dalam suatu batch condong negatif" kurang intuitif daripada fakta komplementer bahwa "jumlah komponen yang salah dalam suatu batch condong positif". (Buku pelajaran bertema industri; Saya lebih suka telur yang pecah dan utuh dalam kotak berisi dua belas). Mungkin siswa merasa bahwa "kesuksesan" harus langka.
Pilihan lain adalah menunjukkan bahwa jika condong positif maka condong negatif, tetapi untuk menempatkan ini dalam konteks praktis ("harga rumah negatif condong negatif") tampaknya ditakdirkan untuk kegagalan pedagogis. Meskipun ada manfaat untuk mengajarkan efek transformasi data, tampaknya bijaksana untuk memberikan contoh nyata terlebih dahulu. Saya lebih suka yang tidak tampak buatan, di mana kemiringan negatif cukup jelas, dan yang mana pengalaman hidup siswa harus memberi mereka kesadaran akan bentuk distribusi.- X
sumber
Jawaban:
Di Inggris, harga sebuah buku. Ada "Harga eceran yang disarankan" yang umumnya akan menjadi harga modal, dan hampir tidak ada tempat Anda harus membayar lebih. Tetapi beberapa toko akan memberikan diskon, dan beberapa toko akan memberikan diskon besar-besaran.
Juga, usia saat pensiun. Kebanyakan orang pensiun pada usia 65-68 yang merupakan masa pensiun negara, sangat sedikit orang yang bekerja lebih lama, tetapi beberapa orang pensiun di usia 50-an dan cukup banyak di usia awal 60-an.
Kemudian juga, jumlah orang GCSE mendapatkan. Sebagian besar anak dimasukkan untuk 8-10 dan jadi mendapatkan 8-10. Sejumlah kecil berbuat lebih banyak. Beberapa anak tidak lulus semua ujian, jadi ada peningkatan yang stabil dari 0 menjadi 7.
sumber
Nick Cox dengan tepat berkomentar bahwa "usia saat kematian cenderung negatif di negara maju" yang saya pikir merupakan contoh yang bagus.
Saya menemukan angka-angka paling nyaman yang bisa saya temui berasal dari Biro Statistik Australia ( khususnya, saya menggunakan lembar Excel ini ), karena nampan usia mereka naik hingga 100 tahun dan laki-laki Australia tertua adalah 111 , jadi saya merasa nyaman memotong nampan terakhir setelah 110 tahun. Badan statistik nasional lainnya sering tampak berhenti pada angka 95 yang membuat tempat sampah terakhir menjadi tidak nyaman. Histogram yang dihasilkan menunjukkan kemiringan negatif yang sangat jelas, serta beberapa fitur menarik lainnya seperti puncak kecil dalam tingkat kematian di antara anak-anak, yang akan cocok untuk diskusi dan interpretasi kelas.
Kode R dengan data mentah berikut,
HistogramTools
paket terbukti sangat berguna untuk memplot berdasarkan data agregat! Berkat pertanyaan StackOverflow ini untuk menandai itu.sumber
Berikut adalah hasil untuk empat puluh atlet yang berhasil menyelesaikan lompatan hukum di babak kualifikasi lompat jauh Olimpiade 2012, disajikan dalam plot kepadatan kernel dengan plot permadani di bawahnya.
Tampaknya jauh lebih mudah untuk menjadi satu meter di belakang kelompok utama pesaing daripada menjadi satu meter di depan, yang akan menjelaskan kemiringan negatif.
Saya menduga beberapa pengelompokan di ujung atas adalah karena atlet menargetkan kualifikasi (yang membutuhkan finish dua belas teratas atau hasil 8,10 meter atau lebih) daripada mencapai jarak terpanjang yang mungkin. Fakta bahwa dua hasil teratas adalah 8,11 meter, tepat di atas tanda kualifikasi otomatis, sangat sugestif, seperti cara lompatan pemenang medali di Final sama-sama lebih panjang dan lebih tersebar di 8,31, 8,16, dan 8,12 meter. Hasil di Final memiliki sedikit condong, tidak signifikan, negatif.
Sebagai perbandingan, hasil untuk Olimpiade Heptathlon di Seoul 1988 tersedia dalam
heptathlon
kumpulan data dalam paket RHSAUR
. Dalam kompetisi itu tidak ada babak kualifikasi tetapi setiap acara berkontribusi poin menuju klasifikasi akhir; para pesaing wanita menunjukkan kemiringan negatif yang jelas dalam hasil lompatan tinggi dan kemiringan agak negatif dalam lompat jauh. Menariknya ini tidak direplikasi dalam peristiwa melempar (menembak dan lembing) meskipun mereka juga peristiwa di mana angka yang lebih tinggi sesuai dengan hasil yang lebih baik. Skor poin akhir juga agak condong negatif.Data dan kode
sumber
Skor pada tes mudah, atau sebagai alternatif, skor pada tes yang dimotivasi oleh siswa, cenderung cenderung miring.
Akibatnya, skor SAT / ACT dari siswa yang masuk mencari perguruan tinggi (dan bahkan lebih tinggi, IPK mereka) cenderung dibiarkan miring. Ada banyak contoh di collegeapps.about.com misalnya sebidang University of Chicago SAT / ACT dan IPK di sini .
Demikian pula IPK lulusan sering condong ke kiri, misalnya histogram di bawah IPK lulusan putih dan hitam di universitas nirlaba yang diambil dari Gambar 5 Gramling, Tim. " Bagaimana lima karakteristik siswa secara akurat memprediksi peluang kelulusan universitas untuk keuntungan ." SAGE Terbuka 3.3 (2013): 2158244013497026.
(Tidak sulit menemukan contoh serupa lainnya.)
sumber
Dalam Analisis Stochastic Frontier, dan khususnya dalam fokus awal historisnya, produksi, fungsi produksi dari suatu perusahaan / unit produksi secara umum, ditetapkan secara stokastik sebagai
di mana adalah output aktual yang dihasilkan oleh perusahaan, dan adalah fungsi produksinya (yang lebih dipahami sebagai hubungan input-output daripada ekspresi matematika yang mencerminkan hubungan "rekayasa") dengan menjadi vektor input produksi (modal, tenaga kerja, energi, bahan, dll). Fungsi produksi dalam Teori Ekonomi merupakan output maksimum , diberikan teknologi dan input, yaitu mewujudkan efisiensi penuh . Maka adalah gangguan normal rata-rata nol pada proses produksi, dan adalah variabel acak non-negatif yang mewakili penyimpangan dari efisiensi penuhf ( x ) x uq f( x ) x kamu w karena alasan yang mungkin tidak diketahui oleh ahli ekonometrik, tetapi ia dapat mengukur melalui pengaturan ini. Variabel acak ini biasanya diasumsikan mengikuti distribusi setengah normal atau eksponensial. Dengan asumsi setengah normal (karena suatu alasan), kita miliki
di mana adalah standar deviasi dari variabel acak normal "mendasar" yang nilai absolutnya adalah Setengah-normal.σ2
Istilah kesalahan komposit ditandai dengan kerapatan berikutε = u - w
Ini adalah kepadatan condong-normal, dengan parameter lokasi , parameter skala dan parameter miring , di mana dan masing-masing adalah pdf dan cdf normal standar. Untuk , densitasnya terlihat seperti ini: s 2 ( - σ 20 s2 ϕΦσu=1,( - σ2σkamu) ϕ Φ σkamu= 1 ,σ2= 3
Jadi kemiringan negatif adalah, saya katakan, pemodelan yang paling alami dari upaya umat manusia itu sendiri: selalu menyimpang dari cita-citanya yang dibayangkan - dalam kebanyakan kasus tertinggal di belakangnya (bagian negatif dari kepadatan), sementara dalam kasus yang relatif lebih sedikit, melampaui batas yang dirasakan (bagian positif dari kepadatan). Siswa sendiri dapat dimodelkan sebagai fungsi produksi. Sangat mudah untuk memetakan gangguan simetris dan kesalahan satu sisi untuk aspek kehidupan nyata. Saya tidak bisa membayangkan bagaimana lebih intuitifnya seseorang bisa mendapatkannya.
sumber
Kecenderungan negatif umum terjadi pada hidrologi banjir. Di bawah ini adalah contoh kurva frekuensi banjir (South Creek di Mulgoa Rd, lat -33.8783, lon 150.7683) yang saya ambil dari 'Australian Rainfall and Runoff' (ARR) panduan untuk estimasi banjir yang dikembangkan oleh Engineers, Australia.
Ada komentar di ARR:
Seringkali banjir, di lokasi tertentu, dianggap memiliki batas atas yang disebut 'Probable Maximum Flood' (PMF). Ada cara standar untuk menghitung PMF.
sumber
Perubahan harga aset (pengembalian) biasanya memiliki kemiringan negatif - banyak kenaikan harga kecil dengan beberapa penurunan harga besar. Kemiringan tampaknya berlaku untuk hampir semua jenis aset: harga saham, harga komoditas, dll. Kemiringan negatif dapat diamati dalam perubahan harga bulanan tetapi jauh lebih jelas ketika Anda mulai melihat perubahan harga harian atau per jam. Saya pikir ini akan menjadi contoh yang baik karena Anda dapat menunjukkan efek frekuensi pada kemiringan.
Lebih detail: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/
sumber
Usia kehamilan saat persalinan (terutama untuk kelahiran hidup) dibiarkan miring. Bayi dapat dilahirkan hidup sangat awal (meskipun kemungkinan kelangsungan hidup kecil ketika terlalu dini), puncaknya antara 36-41 minggu, dan jatuh cepat. Biasanya wanita di AS diinduksi jika 41/42 minggu, jadi kami biasanya tidak melihat banyak pengiriman setelah titik itu.
sumber
Dalam perikanan sering ada contoh condong negatif karena persyaratan peraturan. Misalnya distribusi panjang ikan yang dilepaskan dalam perikanan rekreasi; karena kadang-kadang ada panjang minimum yang harus dimiliki ikan agar bisa dipertahankan semua ikan di bawah batas tersebut dibuang. Tetapi karena orang-orang menangkap ikan di mana ada cenderung panjang ikan legal cenderung ada kecenderungan negatif dan mode menuju batas atas hukum. Panjang hukum tidak mewakili jalan yang sulit. Karena batas kantung (atau batas jumlah ikan yang dapat dibawa kembali ke dermaga), orang masih akan membuang ikan ukuran legal ketika mereka telah menangkap ikan yang lebih besar.
misalnya, Sauls, B. 2012. Ringkasan Data tentang Distribusi Ukuran dan Kondisi Rilis Buang Kakap Merah dari Survei Perikanan Rekreasi di Teluk Meksiko. SEDAR31-DW11. SEDAR, North Charleston, SC. 29 hal.
sumber
Beberapa saran bagus telah dibuat di utas ini. Pada tema kematian terkait usia, tingkat kegagalan mesin sering kali merupakan fungsi dari usia mesin dan akan jatuh ke dalam kelas distribusi ini. Selain faktor-faktor keuangan yang telah dicatat, fungsi dan distribusi kerugian finansial biasanya menyerupai bentuk-bentuk ini, terutama dalam kasus kerugian bernilai ekstrem, misalnya, seperti yang ditemukan dalam perkiraan BIS III (Bank of International Settlement) perkiraan kekurangan yang diharapkan (ES), atau dalam BIS II nilai pada risiko (VAR) sebagai input untuk persyaratan peraturan untuk alokasi cadangan modal.
sumber
Usia pensiun di AS cenderung negatif. Mayoritas pensiunan lebih tua dengan beberapa pensiunan yang relatif muda.
sumber
Dalam teori matriks acak, distribusi Tracy Widom adalah condong ke kanan. Ini adalah distribusi nilai eigen terbesar dari matriks acak. Secara simetri, nilai eigen terkecil memiliki distribusi Tracy Widom negatif, dan karenanya condong ke kiri.
Ini kira-kira karena fakta bahwa nilai eigen acak mirip dengan partikel bermuatan yang saling tolak, dan karenanya nilai eigen terbesar cenderung didorong menjauh dari yang lain. Ini gambar yang berlebihan (diambil dari sini ):
sumber