Saya ingin tahu, atau memiliki referensi tentang, proses analisis yang sebagian besar dilalui oleh analis data statistik untuk setiap proyek analisis data.
Jika saya membuat "daftar", untuk menyelesaikan proyek analisis data, seorang analis harus:
- pertama mengumpulkan persyaratan untuk proyek,
- rencanakan / rancang analisis datanya berdasarkan persyaratan tersebut sebelumnya
- sebenarnya data pra-pemrosesan,
- melaksanakan analisis data dan
- menulis laporan berdasarkan hasil analisisnya.
Untuk pertanyaan ini, saya tertarik pada perincian lebih lanjut dari Langkah 2. Tapi saya mengerti ini tidak secara praktis jelas dipotong karena analis mungkin harus mengubah rencananya atau desain sesuai dengan hasil analisis data. Apakah ada referensi tentang hal ini?
sumber
Saya menemukan Alur Kerja Analisis Data Menggunakan Stata menjadi buku yang bagus, terutama (tetapi tidak hanya) sebagai pengguna Stata. Saya menemukan banyak hal yang tidak disetujui, tetapi bahkan itu membantu menjelaskan mengapa saya melakukan hal-hal dengan cara tertentu.
sumber
CRISP-DM , yang diciptakan oleh perusahaan SPSS (sekarang milik IBM) adalah akronim untuk proses penambangan data, yang sama dengan "analisis data". SAS memiliki proses serupa yang disebut SEMMA .
sumber