Apa gunanya pelaporan statistik deskriptif?

21

Saya baru saja melakukan analisis data saya menggunakan regresi logistik tetapi saya juga diharuskan memiliki bagian Statistik deskriptif dalam laporan saya. Sejujurnya saya tidak mengerti maksudnya dan saya berharap seseorang mungkin bisa menjelaskan mengapa itu perlu.

Misalnya jika saya memplot histogram dari salah satu variabel kontinu independen saya dan itu menunjukkan normalitas atau itu menunjukkan kemiringan bagaimana ini akan menambah nilai pada laporan?

Data saya terdiri dari variabel dependen, benar atau salah, mendapatkan pekerjaan dan variabel independennya adalah nilai-nilai dalam jangka menengah, nilai-nilai dalam ujian akhir, dan pria atau wanita.

pengguna3223190
sumber
Jika Anda tidak dapat melihat nilai apa pun dalam merencanakan histogram IV Anda, mungkin sebaiknya Anda tidak melakukannya, tetapi adakah data yang telah Anda kumpulkan yang menurut Anda bernilai untuk pekerjaan yang Anda presentasikan? laporan?
Ian_Fin
Hai Ian, saya telah menambahkan beberapa detail tentang masalah saya. Saya cukup baru dalam statistik dan saya hanya ingin tahu apakah ada pendekatan umum yang kami ambil sebelum kami melakukan regresi logistik.
user3223190
Saya sarankan juga melihat dan mungkin memasukkan berbagai plot data. Misalnya, Anda dapat memplot nilai akhir vs nilai jangka menengah dikodekan oleh jenis kelamin dan kode simbol oleh "mendapat pekerjaan" dan "gagal mendapatkan pekerjaan".
Emil M Friedman

Jawaban:

42

Di bidang saya, bagian deskriptif dari laporan ini sangat penting karena menetapkan konteks untuk generalisasi dari hasil. Sebagai contoh, seorang peneliti ingin mengidentifikasi prediktor cedera otak traumatis setelah kecelakaan sepeda motor dalam sampel dari rumah sakit. Variabel dependennya adalah biner dan ia memiliki serangkaian variabel independen. Regresi logistik multivariabel memungkinkannya menghasilkan temuan-temuan berikut:

  • tidak ada penggunaan helm yang disesuaikan OR = 4,5 (95% CI 3,6, 5,5) dibandingkan dengan penggunaan helm.
  • semua variabel lain tidak dimasukkan dalam model akhir.

Agar jelas, tidak ada masalah dengan pemodelan. Kami fokus pada nilai yang dapat ditambahkan statistik deskriptif.

Tanpa statistik deskriptif, pembaca tidak dapat menempatkan temuan ini dalam perspektif. Mengapa? Biarkan saya tunjukkan statistik deskriptif:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Anda dapat melihat dari contoh di atas bahwa sampelnya terdiri dari pria yang lebih tua dan mabuk. Dengan informasi ini pembaca dapat mengatakan apa, jika ada, hasil ini dapat mengatakan tentang cedera pada pria muda atau cedera pada pengendara yang tidak mabuk atau pada pengendara wanita.

Tolong jangan abaikan statistik deskriptif.


sumber
5
Contoh yang bagus. Apakah itu nyata atau dibuat-buat?
Amoeba berkata Reinstate Monica
5
Terima kasih, @amoeba. Angka dan statistik itu nyata. Namun, saya mengubah topik menjadi cedera otak traumatis untuk melindungi yang tidak bersalah.
3
Jadi, pria mabuk mengendarai sepeda motor tanpa helm ... Siapa yang menyangka Anda bisa berakhir dengan cedera otak traumatis?
gung - Reinstate Monica
Saya menikmati segelas merah Australia yang bagus pada saat itu dan Bob adalah paman Anda ...
25

Maksud dari menyediakan statistik deskriptif adalah untuk mengkarakterisasi sampel Anda sehingga orang-orang di pusat atau negara lain dapat menilai apakah hasil Anda digeneralisasikan dengan situasi mereka. Jadi, dalam kasus Anda, menaburkan jenis kelamin, nilai dan sebagainya akan menjadi tambahan yang bermanfaat untuk regresi logistik. Ini tidak memungkinkan orang untuk memeriksa asumsi Anda walaupun mereka mungkin mencoba melakukannya juga.

============== Edit untuk memberikan tautan ke beberapa pedoman yang digunakan dalam kesehatan

Di bidang yang saya kenal, kesehatan, ada pedoman khusus untuk pelaporan. Ini telah dikumpulkan bersama dalam jaringan EQUATOR yang harus dikonsultasikan untuk perincian terkini.

Sebagai contoh, kita dapat mengambil uji klinis di mana pedoman yang relevan adalah CONSORT. Dalam dokumen yang menguraikan pedoman yang tersedia di sini dan di tempat lain kita baca di Tabel 1 rekomendasi 15 "Sebuah tabel yang menunjukkan karakteristik demografi dan klinis dasar untuk setiap kelompok".

Ada rekomendasi serupa untuk jenis studi lainnya.

Nyonya
sumber
Terima kasih mdewey, jadi ketika kami melakukan berbagai plot deskriptif dan jika kami melihat normalitas atau condong mengapa hanya berkomentar saja. Dan pada dasarnya statistik deskriptif hanya digunakan untuk memberi tahu pembaca tentang data apa yang sedang Anda kerjakan. Sangat menyesal jika ini mungkin tampak elementer
user3223190
Begitulah cara kerjanya di bidang kesehatan yang merupakan hal yang paling saya kenal.
mdewey
8
+1. Pada awalnya saya salah membaca "di pusat atau negara lain" sebagai "di abad lain".
Amoeba berkata Reinstate Monica
4

Hal lain adalah menunjukkan seberapa baik variabel Anda berperilaku. Jika, misalnya, salah satu variabel Anda adalah gaji, dan Anda telah mewawancarai tepat satu miliarder, ketika Anda memasukkan gajinya ke dalam regresi logistik akan mendominasi semua yang lain, maka Anda kemungkinan akan belajar mengabaikan gaji, terlepas dari berapa banyak informasi aktual yang dimilikinya.

Beberapa metode lebih sensitif daripada yang lain untuk kemiringan dan nilai-nilai ekstrem, dan regresi logistik lebih pada sisi sensitif. Tentu saja, bukti terakhir ada di puding, dan Anda dapat membandingkan hasil yang diperoleh dengan data mentah, atau dengan setiap fitur ditransformasikan menjadi normal.

Davidmh
sumber
1

Bagian deskriptif membantu memahami pembaca dataset Anda. Dalam ekon terapan, biasanya sangat dianjurkan karena dapat menunjukkan kelemahan potensial pertama dalam analisis Anda.

Anda dapat menggunakan data dari berbagai sumber untuk meledakkan keterangan Anda.

1 meja sudah cukup. Yang Anda lampirkan tidak terlalu intuitif.

Bonsaibubble
sumber