Jumlah angka signifikan untuk dimasukkan ke dalam tabel?

13

Apakah ada aturan yang cukup beralasan untuk menerbitkan angka-angka penting?

Berikut adalah beberapa contoh / pertanyaan spesifik:

  • Apakah ada cara untuk menghubungkan jumlah angka signifikan dengan koefisien variasi? Misalnya, jika perkiraannya adalah 12,3 dan CV adalah 50%, apakah itu berarti bahwa informasi yang diwakili oleh '.3' mendekati nol?

  • Jika interval kepercayaan memiliki kisaran urutan besarnya, apakah mereka masih memiliki jumlah angka signifikan yang sama, misalnya:

    12.3 (1.2, 123.4) vs 12 (1.2, 120)

  • Haruskah jumlah angka signifikan dalam estimasi kesalahan sama atau kurang dari jumlah angka signifikan dalam rata-rata?

David LeBauer
sumber
Jika Anda bisa, jangan gunakan tabel :) Grafiknya adalah, IMO, hampir selalu lebih mudah dibaca daripada sebuah tabel (kecuali jika Anda tidak memiliki banyak angka). Jurnal dan pengulas mereka tidak selalu setuju, sayangnya ....
JMS
3
@JMS Poin bagus, tetapi Tabel berguna untuk meringkas karakteristik terperinci dari unit statistik (diklasifikasi silang berdasarkan minat faktor, misalnya diagnosis klinis atau apa pun), dengan variabel dari berbagai jenis (kontinu, nominal, dan ordinal), dan hasil lainnya yang diperoleh dari pemodelan statistik per se (matriks kebingungan, koefisien regresi, dll.) yang tidak akan cocok dengan Angka (atau tidak selalu jika Anda menganggap pendekatan Gelman untuk menunjukkan reg. coef. sebagai dotcharts). Kita membutuhkan keduanya; pertanyaannya adalah kapan kita benar-benar membutuhkan Figur, bukan Table, IMO.
chl
@chi Fair. Saya memang mengatakan hampir selalu :). Hal-hal seperti tabel n-arah yang besar tidak mungkin (sepenuhnya) mereproduksi secara grafis. Itu tergantung pada forum yang saya katakan. Tabel memiliki manfaat lengkap, tentu saja, tetapi apakah pembaca Anda benar-benar menyerap semua informasi tambahan itu? Jika ada terlalu banyak parameter untuk dimasukkan dalam grafik, saya berpendapat bahwa sebuah tabel seringkali paling tidak sulit dibaca. Namun, saya pikir hasil yang lengkap harus dapat diakses (online, apendiks, dll) jika tidak lain adalah reproduktifitas. Dalam hal ini saya juga ingin data & kode! Berkeliaran di OT, maaf ..
JMS
Juga saya pikir koefisien regresi dan kebingungan (korelasi, kovarian, ...) matriks biasanya lebih cocok untuk tampilan grafis, dotplot atau serupa untuk yang sebelumnya dan heatmaps atau grafik untuk yang terakhir.
JMS
@ JMS Saya setuju dengan poin Anda, tetapi dalam kasus ini ada batas angka, beberapa kasus lain ada biaya gambar. Juga, dalam hal ini jika pembaca melirik ke atas meja dan fokus pada angka-angka yang disajikan, maka mereka tidak akan membuang-buang waktu untuk mencari tahu poin dari sosok esoterik. Tapi saya sepenuhnya mendukung reproduktifitas, dan sementara saya melakukannya, saya bisa (jika saya bisa melakukannya) menambahkan visualisasi tabel ke kode yang dilampirkan.
David LeBauer

Jawaban:

19

Saya ragu ada aturan universal jadi saya tidak akan mengada-ada. Saya dapat membagikan pemikiran ini dan alasan di baliknya:

  • Ketika ringkasan mencerminkan data itu sendiri - maks, min, statistik pesanan, dll .-- gunakan angka penting yang sama dengan yang digunakan untuk merekam data di tempat pertama. Ini memberikan representasi yang konsisten di seluruh dokumen mengenai ketepatan data.

  • nn3n3030<n300

    -Catat bahwa CV tidak memberikan informasi yang berguna dalam hal ini.

    -Beberapa perkiraan dapat diperoleh dengan sangat presisi. Mereka tidak harus dibulatkan untuk mencocokkan sesuatu yang lain. Misalnya, rata-rata 1.000.000 bilangan bulat mungkin 10.977 dengan kesalahan standar 0,00301. Keputusan saya untuk menulis mean ke tiga tempat desimal (dan 4-5 gambar ara) didasarkan pada urutan besarnya SE, yang menunjukkan angka terakhir sebagian dapat diandalkan. Keputusan untuk menulis SE ke tiga sig ig (lima tempat desimal) lebih sewenang-wenang: dua ara sig akan bekerja; yang satu mungkin tidak; empat ara ara juga akan bekerja dan konsisten dengan ara 4-5 ara dalam rata-rata; lebih dari empat ara ig akan berlebihan. (Seseorang dapat memperkirakan kesalahan standar dari SE itu sendiri dalam hal momen keempat dari data, dan menggunakannya untuk menentukan jumlah pembulatan yang tepat, tetapi kebanyakan dari kita tidak pergi ke masalah seperti itu ...)

  • Memberi sinyal kepada pembaca ketika Anda melakukan pembulatan substansial . Berhati-hatilah saat laporan sedang membahas uji statistik itu sendiri . Alasannya adalah orang-orang dapat menggunakan pekerjaan Anda untuk memeriksa perhitungan mereka sendiri. Kadang-kadang bahkan sedikit perbedaan dapat mengungkapkan kesalahan. Anda tidak ingin menimbulkan masalah karena Anda membulatkan 123 ke 120 dan orang lain, memeriksa pekerjaan, mendapatkan 123 dan mencurigai salah satu dari Anda telah melakukan kesalahan.

  • Bersikaplah konsisten . Anda mungkin kehilangan beberapa pembaca jika daftar nilai 123 pada satu titik dan kemudian referensi sebagai 120.

  • Jangan konyol . (Saya secara otomatis mencurigai ketidakmampuan ketika saya menemukan laporan yang memberikan hasil statistik kepada 15 sig ig ketika data hanya memiliki dua sig ig, misalnya.)

whuber
sumber
2
+1 saya sangat besar karena sangat banyak saran bagus. Dalam nada yang sama, saya ingin menunjukkan kepada siswa bahwa tidak ada gunanya untuk meringkas data yang dikumpulkan dari survei (atau suara) sebagai% dengan banyak desimal tanpa mempertimbangkan ukuran sampel (yang berdampak kesalahan standar).
chl
0

Saya sarankan 12 (1.2, 123.4). Abaikan .3 karena hampir tidak berarti, tetapi banyak orang ketika mereka melihat (1.2, 120) akan menganggap bahwa '0' terakhir dalam 120 adalah signifikan.

AVB
sumber
Mengapa Anda menyarankan untuk menghilangkan desimal untuk statistik yang menarik jika Anda setuju untuk menunjukkannya dalam CI (yaitu, jika tidak ada artinya untuk 12, mengapa masuk akal untuk 123,4)?
chl
@ chl: itu tidak masuk akal, tetapi menghilangkannya mungkin menyesatkan. Jika saya memasukkan 123,4, seseorang seperti Anda akan melihat angka tambahan dan mengabaikannya, tidak ada salahnya dilakukan. Jika saya memasukkan 120, banyak pembaca akan berpikir ini akurat hingga 3 digit - buruk.
AVB
masih belum jelas mengapa Anda merekomendasikan 123,4, bukan 123 (mengapa mengabaikan 0,3 tetapi tidak 0,4 dalam contoh?)
David LeBauer