Saya baru saja melakukan analisis data saya menggunakan regresi logistik tetapi saya juga diharuskan memiliki bagian Statistik deskriptif dalam laporan saya. Sejujurnya saya tidak mengerti maksudnya dan saya berharap seseorang mungkin bisa menjelaskan mengapa itu perlu.
Misalnya jika saya memplot histogram dari salah satu variabel kontinu independen saya dan itu menunjukkan normalitas atau itu menunjukkan kemiringan bagaimana ini akan menambah nilai pada laporan?
Data saya terdiri dari variabel dependen, benar atau salah, mendapatkan pekerjaan dan variabel independennya adalah nilai-nilai dalam jangka menengah, nilai-nilai dalam ujian akhir, dan pria atau wanita.
descriptive-statistics
reporting
pengguna3223190
sumber
sumber
Jawaban:
Di bidang saya, bagian deskriptif dari laporan ini sangat penting karena menetapkan konteks untuk generalisasi dari hasil. Sebagai contoh, seorang peneliti ingin mengidentifikasi prediktor cedera otak traumatis setelah kecelakaan sepeda motor dalam sampel dari rumah sakit. Variabel dependennya adalah biner dan ia memiliki serangkaian variabel independen. Regresi logistik multivariabel memungkinkannya menghasilkan temuan-temuan berikut:
Agar jelas, tidak ada masalah dengan pemodelan. Kami fokus pada nilai yang dapat ditambahkan statistik deskriptif.
Tanpa statistik deskriptif, pembaca tidak dapat menempatkan temuan ini dalam perspektif. Mengapa? Biarkan saya tunjukkan statistik deskriptif:
Anda dapat melihat dari contoh di atas bahwa sampelnya terdiri dari pria yang lebih tua dan mabuk. Dengan informasi ini pembaca dapat mengatakan apa, jika ada, hasil ini dapat mengatakan tentang cedera pada pria muda atau cedera pada pengendara yang tidak mabuk atau pada pengendara wanita.
Tolong jangan abaikan statistik deskriptif.
sumber
Maksud dari menyediakan statistik deskriptif adalah untuk mengkarakterisasi sampel Anda sehingga orang-orang di pusat atau negara lain dapat menilai apakah hasil Anda digeneralisasikan dengan situasi mereka. Jadi, dalam kasus Anda, menaburkan jenis kelamin, nilai dan sebagainya akan menjadi tambahan yang bermanfaat untuk regresi logistik. Ini tidak memungkinkan orang untuk memeriksa asumsi Anda walaupun mereka mungkin mencoba melakukannya juga.
============== Edit untuk memberikan tautan ke beberapa pedoman yang digunakan dalam kesehatan
Di bidang yang saya kenal, kesehatan, ada pedoman khusus untuk pelaporan. Ini telah dikumpulkan bersama dalam jaringan EQUATOR yang harus dikonsultasikan untuk perincian terkini.
Sebagai contoh, kita dapat mengambil uji klinis di mana pedoman yang relevan adalah CONSORT. Dalam dokumen yang menguraikan pedoman yang tersedia di sini dan di tempat lain kita baca di Tabel 1 rekomendasi 15 "Sebuah tabel yang menunjukkan karakteristik demografi dan klinis dasar untuk setiap kelompok".
Ada rekomendasi serupa untuk jenis studi lainnya.
sumber
Hal lain adalah menunjukkan seberapa baik variabel Anda berperilaku. Jika, misalnya, salah satu variabel Anda adalah gaji, dan Anda telah mewawancarai tepat satu miliarder, ketika Anda memasukkan gajinya ke dalam regresi logistik akan mendominasi semua yang lain, maka Anda kemungkinan akan belajar mengabaikan gaji, terlepas dari berapa banyak informasi aktual yang dimilikinya.
Beberapa metode lebih sensitif daripada yang lain untuk kemiringan dan nilai-nilai ekstrem, dan regresi logistik lebih pada sisi sensitif. Tentu saja, bukti terakhir ada di puding, dan Anda dapat membandingkan hasil yang diperoleh dengan data mentah, atau dengan setiap fitur ditransformasikan menjadi normal.
sumber
Bagian deskriptif membantu memahami pembaca dataset Anda. Dalam ekon terapan, biasanya sangat dianjurkan karena dapat menunjukkan kelemahan potensial pertama dalam analisis Anda.
Anda dapat menggunakan data dari berbagai sumber untuk meledakkan keterangan Anda.
1 meja sudah cukup. Yang Anda lampirkan tidak terlalu intuitif.
sumber