Apa itu proses analisis data yang praktis bagus?

15

Saya ingin tahu, atau memiliki referensi tentang, proses analisis yang sebagian besar dilalui oleh analis data statistik untuk setiap proyek analisis data.

Jika saya membuat "daftar", untuk menyelesaikan proyek analisis data, seorang analis harus:

  1. pertama mengumpulkan persyaratan untuk proyek,
  2. rencanakan / rancang analisis datanya berdasarkan persyaratan tersebut sebelumnya
  3. sebenarnya data pra-pemrosesan,
  4. melaksanakan analisis data dan
  5. menulis laporan berdasarkan hasil analisisnya.

Untuk pertanyaan ini, saya tertarik pada perincian lebih lanjut dari Langkah 2. Tapi saya mengerti ini tidak secara praktis jelas dipotong karena analis mungkin harus mengubah rencananya atau desain sesuai dengan hasil analisis data. Apakah ada referensi tentang hal ini?

Tae-Sung Shin
sumber

Jawaban:

17

"Rencana" atau "daftar" favorit saya adalah dokumen Scott Emerson yang Mengatur Pendekatan Anda terhadap Analisis Data .

Catatan: dua halaman terakhir berada di bawah judul "Persyaratan Umum untuk Ph.D. Ujian Terapan" tetapi saran yang diberikan di sana menggeneralisasi untuk mengerjakan masalah analisis apa pun.


sumber
Cintai setiap bagian dokumen. Terima kasih atas referensi yang berharga.
Tae-Sung Shin
5

Saya menemukan Alur Kerja Analisis Data Menggunakan Stata menjadi buku yang bagus, terutama (tetapi tidak hanya) sebagai pengguna Stata. Saya menemukan banyak hal yang tidak disetujui, tetapi bahkan itu membantu menjelaskan mengapa saya melakukan hal-hal dengan cara tertentu.

Dimitriy V. Masterov
sumber
4
+1 tetapi, peringatan emptor : buku ini hanya berharga jika Anda adalah pengguna Stata. Saya tidak menggunakan Stata (sebenarnya saya tidak pernah punya). Di sisi lain, saya suka Long, jadi saya memeriksa ini dari perpustakaan. Saya yakin ada banyak info bagus di sana untuk semua orang, tetapi sangat terkait dengan penggunaan Stata sehingga mustahil untuk mengekstrak informasi umum domain.
gung - Reinstate Monica
2

CRISP-DM , yang diciptakan oleh perusahaan SPSS (sekarang milik IBM) adalah akronim untuk proses penambangan data, yang sama dengan "analisis data". SAS memiliki proses serupa yang disebut SEMMA .

Galit Shmueli
sumber