Ini mungkin juga turun sebagai pertanyaan paling konyol yang pernah diajukan di forum ini, tetapi setelah menerima jawaban yang masuk akal dan bermakna untuk pertanyaan sebelumnya, saya pikir saya akan merentangkan keberuntungan saya lagi.
Saya telah sangat bingung selama beberapa waktu tentang pentingnya distribusi statistik terutama karena berkaitan dengan pengembalian aset dan bahkan lebih khusus lagi dalam alokasi aset.
Pertanyaan saya untuk lebih spesifik adalah: Asumsikan saya memiliki 20 tahun data pengembalian bulanan S&P 500, mengapa saya harus mengasumsikan jenis distribusi tertentu (yaitu penerbangan Normal / Johnson / Levy dll) untuk keputusan alokasi aset saya ketika saya bisa dengan mudah hanya membuat keputusan alokasi aset saya berdasarkan data historis yang saya miliki dengan saya?
sumber
Jawaban:
Menggunakan distribusi yang diasumsikan (mis. Analisis parametrik) akan mengurangi biaya komputasi metode Anda. Saya berasumsi bahwa Anda ingin melakukan tugas regresi atau klasifikasi. Ini berarti bahwa pada titik tertentu Anda akan memperkirakan distribusi beberapa data. Metode nonparametrik berguna ketika data tidak sesuai dengan distribusi yang dipelajari dengan baik, tetapi mereka biasanya membutuhkan lebih banyak waktu untuk menghitung atau lebih banyak memori untuk disimpan.
Juga jika data dihasilkan oleh suatu proses yang sesuai dengan suatu distribusi, seperti mereka adalah rata-rata dari beberapa proses acak yang seragam, maka menggunakan distribusi itu lebih masuk akal. Dalam kasus rata-rata satu set variabel seragam, distribusi yang benar mungkin adalah Distribusi Gaussian.
sumber
Melengkapi jawaban James : model parametrik juga (biasanya) memerlukan lebih sedikit sampel untuk memiliki kecocokan yang baik: ini dapat meningkatkan kekuatan generalisasi mereka: yaitu, mereka dapat memperkirakan data baru dengan lebih baik, bahkan menjadi salah. Tentu saja, ini tergantung pada situasi, model dan ukuran sampel.
sumber