Jika ada, antara memasang garis ke beberapa "percobaan" terpisah kemudian rata-rata cocok, atau rata-rata data dari eksperimen terpisah kemudian paskan data rata-rata. Biarkan saya uraikan:
Saya melakukan simulasi komputer yang menghasilkan kurva, ditunjukkan di bawah ini. Kami mengekstrak kuantitas, sebut saja "A" dengan menyesuaikan wilayah linier plot (lama). Nilainya hanyalah kemiringan wilayah linier. Tentu saja ada kesalahan yang terkait dengan regresi linier ini.
Kami biasanya menjalankan 100 atau lebih dari simulasi ini dengan kondisi awal yang berbeda untuk menghitung nilai rata-rata "A". Saya telah diberitahu bahwa lebih baik untuk menyamakan data mentah (dari plot di bawah) ke dalam kelompok katakanlah 10, kemudian cocok untuk "A" dan rata-rata 10 "A" itu bersama-sama.
Saya tidak punya intuisi apakah ada manfaat untuk itu atau jika itu lebih baik daripada menyesuaikan 100 nilai "A" individu dan rata-rata.
Jawaban:
Bayangkan kita berada dalam konteks data panel di mana ada variasi lintas waktu dan lintas perusahaan . Pikirkan setiap periode waktu sebagai percobaan terpisah. Saya memahami pertanyaan Anda apakah setara dengan memperkirakan efek menggunakan:t i t
Jawabannya secara umum adalah tidak.
Pengaturan:
Dalam formulasi saya, kita dapat menganggap setiap periode waktu sebagai eksperimen terpisah.t
Katakanlah Anda memiliki panel panjang seimbang di atas perusahaan. Jika kita memecah setiap periode waktu dll ... kita dapat menulis data keseluruhan sebagai:T n (Xt,yt)
Rata-rata cocok:
Kesesuaian rata-rata:
Secara umum ini tidak sama dengan estimasi berdasarkan variasi cross-sectional dari rata-rata deret waktu (yaitu antara estimator).
Di mana dll ...x¯i=1T∑txt,i
Taksiran OLS yang dikumpulkan:
Sesuatu yang mungkin berguna untuk dipikirkan adalah perkiraan OLS yang dikumpulkan. Apa itu? Kemudian gunakan
Mari dan menjadi taksiran kami untuk pada sampel penuh dan dalam periode masing-masing. Maka kita memiliki:S=1nT∑iX′X St=1nX′tXt E[xx′] t
Ini seperti rata-rata dari perkiraan waktu spesifik yang berbeda , tetapi ini sedikit berbeda. Dalam beberapa pengertian, Anda memberikan bobot lebih untuk periode dengan varians yang lebih tinggi dari variabel sisi kanan.bt
Kasus khusus: variabel sisi kanan invarian waktu dan spesifik perusahaan
Jika hak sisi variabel untuk setiap perusahaan yang konstan di waktu (yaitu untuk setiap dan ) maka untuk semua dan kita akan memiliki:i Xt1=Xt2 t1 t2 S=St t
Komentar menyenangkan:
Ini adalah kasus Fama dan Macbeth di mana ketika mereka menerapkan teknik ini rata-rata perkiraan cross-sectional untuk mendapatkan kesalahan standar yang konsisten ketika memperkirakan bagaimana pengembalian yang diharapkan bervariasi dengan kovarians perusahaan dengan pasar (atau pemuatan faktor lainnya).
Prosedur Fama-Macbeth adalah cara intuitif untuk mendapatkan kesalahan standar yang konsisten dalam konteks panel ketika istilah kesalahan dikorelasikan secara lintas-bagian tetapi independen sepanjang waktu. Teknik yang lebih modern yang menghasilkan hasil serupa adalah pengelompokan tepat waktu.
sumber
(Catatan: Saya tidak memiliki reputasi yang cukup untuk berkomentar, jadi saya memposting ini sebagai jawaban.)
Untuk pertanyaan khusus yang diajukan, jawaban oleh fcop benar: pas rata-rata sama dengan rata-rata cocok (setidaknya untuk linear kuadrat terkecil). Namun perlu disebutkan bahwa salah satu dari pendekatan " online " naif ini dapat memberikan hasil yang bias, dibandingkan dengan menyesuaikan semua data sekaligus. Karena keduanya setara, saya akan fokus pada pendekatan "sesuai rata-rata". Pada dasarnya, menyesuaikan kurva rata-rata mengabaikan ketidakpastian relatif dalam nilai-nilai antara poin yang berbeda . Misalnya jika , , dan , makay¯[x]=⟨y[x]⟩ y x y1[x1]=y2[x1]=2 y1[x2]=1 y1[x2]=3 y¯[x1]=y¯[x2]=2 , tetapi kurva apa pun yang cocok harus lebih peduli tentang ketidakcocokan di dibandingkan dengan .x1 x2
Perhatikan bahwa sebagian besar platform perangkat lunak ilmiah harus memiliki alat untuk menghitung / memperbarui kotak kuadrat "online" yang sebenarnya (dikenal sebagai kuadrat terkecil rekursif ). Jadi semua data dapat digunakan (jika ini diinginkan).
sumber