Apa perbedaan filosofis, metodologis, dan terminologis utama antara ekonometrik dan bidang statistik lainnya?

70

Ekonometrik memiliki tumpang tindih yang substansial dengan statistik tradisional, tetapi sering menggunakan jargonnya sendiri tentang berbagai topik ("identifikasi," "eksogen," dll.). Saya pernah mendengar seorang profesor statistik terapan di bidang lain berkomentar bahwa istilahnya sering berbeda tetapi konsepnya sama. Namun ia juga memiliki metode dan perbedaan filosofisnya sendiri (esai terkenal Heckman muncul di benak).

Apa perbedaan terminologi yang ada antara ekonometrika dan statistik arus utama, dan di mana bidang berbeda untuk menjadi berbeda dalam lebih dari sekedar terminologi?

Ari B. Friedman
sumber

Jawaban:

96

Ada beberapa perbedaan terminologis di mana hal yang sama disebut nama yang berbeda dalam disiplin ilmu yang berbeda:

  1. Data longitudinal dalam biostatistik adalah pengamatan berulang pada individu yang sama = data panel dalam ekonometrik.
  2. Model untuk variabel dependen biner di mana probabilitas 1 dimodelkan sebagai disebut model logit dalam ekonometrik, dan model logistik dalam biostatistik. Ahli biostasis cenderung bekerja dengan regresi logistik dalam hal rasio odds, karena mereka sering bersifat biner, sehingga odds ratio mewakili frekuensi relatif dari hasil yang diinginkan pada dua kelompok dalam populasi. Ini adalah interpretasi yang umum sehingga Anda akan sering melihat variabel kontinu diubah menjadi dua kategori (tekanan darah rendah vs tinggi) untuk membuat interpretasi ini lebih mudah.x1/(1+exp[xβ])x
  3. "Persamaan estimasi" ahli statistik adalah "kondisi momen" ekonometrika. Statistik -estimates yang ekonometri estimator ekstrem.M

Ada perbedaan terminologis di mana istilah yang sama digunakan untuk mengartikan hal yang berbeda dalam disiplin ilmu yang berbeda:

  1. Efek tetap berarti dalam persamaan regresi untuk ahli statistik ANOVA, dan untuk estimator "dalam" untuk para ahli ekonometrika.xβ
  2. Kesimpulan kuat berarti kesalahan standar yang dikoreksi secara heteroskedastisitas untuk ekonom (dengan ekstensi ke kesalahan standar yang dikelompokkan dan / atau kesalahan standar yang dikoreksi-autokorelasi) dan metode yang kuat untuk jauh melampaui pencilan statistik.
  3. Tampaknya para ekonom memiliki ide konyol bahwa sampel bertingkat adalah mereka yang probabilitas seleksi bervariasi di antara pengamatan. Ini harus disebut sampel probabilitas tidak sama. Sampel berstrata adalah sampel di mana populasi dibagi menjadi kelompok-kelompok yang telah ditentukan sebelumnya sesuai dengan karakteristik yang diketahui sebelum pengambilan sampel dilakukan.
  4. "Penambangan data" ahli ekonometrika (setidaknya dalam literatur tahun 1980-an) digunakan untuk mengartikan berbagai pengujian dan perangkap yang terkait dengannya yang telah dijelaskan secara menakjubkan dalam buku Harrell . Prosedur penambangan data ilmuwan komputer (dan ahli statistik) adalah metode non-parametrik untuk menemukan pola dalam data, juga dikenal sebagai pembelajaran statistik .

Saya melihat kontribusi unik ekonometrik menjadi

  1. Cara untuk berurusan dengan endogenitas dan model regresi yang tidak ditentukan, mengakui, sebagaimana mpiktas telah menjelaskan dalam jawaban lain , bahwa (i) variabel penjelas mungkin sendiri acak (dan karenanya berkorelasi dengan kesalahan regresi yang menghasilkan bias dalam estimasi parameter), (ii) model dapat menderita dari variabel yang dihilangkan (yang kemudian menjadi bagian dari istilah kesalahan), (iii) mungkin ada heterogenitas yang tidak teramati tentang bagaimana agen ekonomi bereaksi terhadap rangsangan, sehingga menyulitkan model regresi standar. Angrist & Pischke adalah ulasan yang bagus tentang masalah ini, dan ahli statistik akan belajar banyak tentang bagaimana melakukan analisis regresi darinya. Paling tidak, ahli statistik harus belajar dan memahami regresi variabel instrumental.
  2. Secara umum, para ekonom ingin membuat asumsi sesedikit mungkin tentang model mereka, sehingga untuk memastikan bahwa temuan mereka tidak bergantung pada sesuatu yang konyol seperti normalitas multivariat. Itu sebabnya GMM sangat populer dengan ekonom, dan tidak pernah terjebak dalam statistik (meskipun itu digambarkan sebagai minimum oleh Ferguson pada akhir tahun 1960). Itu sebabnya adopsi kemungkinan empiris tumbuh secara eksponensial dalam ekonometrik, dengan sedikit pengikut dalam statistik. Itu sebabnya para ekonom menjalankan regresi mereka dengan kesalahan standar "kuat", dan ahli statistik, dengan OLS default kesalahan standar.s 2 ( X X ) - 1χ2s2(XX)1
  3. Ada banyak pekerjaan dalam domain waktu dengan proses spasi secara teratur - begitulah cara mengumpulkan data ekonomi makro. Kontribusi unik mencakup proses terintegrasi dan terkointegrasi dan metode heteroskedastisitas kondisional autoregresif (G) ARCH). Menjadi orang mikro umumnya, saya kurang akrab dengan ini.

Secara keseluruhan, ekonom cenderung mencari interpretasi yang kuat dari koefisien dalam model mereka. Para ahli statistik akan menggunakan model logistik sebagai cara untuk mendapatkan probabilitas hasil positif, seringkali sebagai alat prediksi sederhana, dan mungkin juga mencatat interpretasi GLM dengan properti keluarga eksponensial yang bagus yang dimilikinya, serta koneksi dengan analisis diskriminan. Ekonom akan berpikir tentang interpretasi utilitas dari model logit, dan khawatir bahwa hanya yang diidentifikasi dalam model ini, dan bahwa heteroskedastisitas dapat membuangnya. (Ahli statistik akan bertanya-tanya apa ituσβ/σσ adalah para ekonom yang berbicara tentang, tentu saja.) Tentu saja, sebuah utilitas yang linier dalam inputnya adalah hal yang sangat lucu dari perspektif Ekonomi Mikro 101, meskipun beberapa generalisasi ke fungsi semi-cekung mungkin dilakukan di Mas-Collel.

Apa yang umumnya cenderung dilewatkan oleh para ekonom, tetapi, IMHO, akan mendapat manfaat dari, adalah aspek-aspek analisis multivariat (termasuk model variabel laten sebagai cara untuk mengatasi kesalahan pengukuran dan banyak proxy ... ahli statistik tidak menyadari model-model ini, meskipun, juga) , diagnostik regresi (semua jarak Cook ini, Mallows 'Cp, DFBETA, dll.), Analisis data yang hilang (identifikasi parsial Manski tentu saja bagus, tetapi penguraian MCAR / MAR / NMAR utama dan beberapa imputasi lebih berguna), dan statistik survei. Banyak kontribusi lain dari statistik arus utama telah dihibur oleh ekonometrika dan baik diadopsi sebagai metodologi standar, atau disahkan sebagai mode jangka pendek: model ARMA tahun 1960-an mungkin lebih dikenal dalam ekonometrik daripada dalam statistik, karena beberapa program pascasarjana dalam statistik mungkin gagal untuk menawarkan kursus seri waktu hari ini; estimator penyusutan / regresi ridge tahun 1970-an telah datang dan pergi; bootstrap tahun 1980-an adalah reaksi spontan untuk setiap situasi yang rumit, walaupun para ekonom perlu lebih menyadari keterbatasan bootstrap tersebut.; kemungkinan empiris dari tahun 1990-an telah melihat lebih banyak pengembangan metodologi dari para ahli ekonometrik teoretis daripada dari ahli statistik teoretis; metode Bayesian komputasi tahun 2000-an dihibur dalam ekonometrik, tetapi perasaan saya adalah yang terlalu parametrik, terlalu berbasis model, agar kompatibel dengan paradigma kekokohan yang saya sebutkan sebelumnya. Apakah para ekonom akan menemukan penggunaan pembelajaran statistik / bioinformatika atau hal-hal temporal yang sangat panas dalam statistik modern adalah panggilan terbuka.

Tugas
sumber
14
+1 Ini adalah contoh luar biasa dari jawaban hebat apa yang bisa muncul ketika sebuah pertanyaan dibuka ke komunitas yang beragam .
Whuber
1
@whuber, terima kasih atas komentarnya. Membagi disiplin membuat saya gila, terus terang.
Tugas
@StasK Jawaban yang sangat bagus. Tapi satu titik cepat. "Secara keseluruhan, ekonom cenderung mencari interpretasi yang kuat dari koefisien dalam model mereka." Sebenarnya, ini agak keliru karena dalam analisis VAR (yang sangat populer maka pernyataan Anda tidak boleh dikatakan dalam hal "keseluruhan") titik pusatnya adalah dalam menafsirkan fungsi respon impuls daripada menafsirkan koefisien model (sering kali , mereka terlalu rumit untuk mencoba menafsirkan).
Graeme Walsh
@ GremeWalsh - Saya mengerti, seperti yang saya katakan, saya tidak bekerja dalam seri makro / waktu. Terima kasih telah menunjukkan ini.
Tugas
20

Cara terbaik untuk menjelaskan dalam hal regresi linier, karena merupakan alat utama ekonometrik. Dalam regresi linier kami memiliki model:

Y=Xβ+ε

Perbedaan utama antara bidang statistik lain dan ekonometrik adalah diperlakukan sebagai tetap di bidang lain dan diperlakukan sebagai variabel acak dalam ekonometrik. Perhatian ekstra yang harus Anda gunakan untuk menyesuaikan perbedaan ini menghasilkan jargon dan metode yang berbeda. Secara umum Anda dapat mengatakan bahwa semua metode yang digunakan dalam ekonometrik adalah metode yang sama seperti di bidang statistik lainnya dengan penyesuaian untuk keacakan variabel penjelas. Pengecualian penting adalah GMM , yang merupakan alat ekonometrik unik.X

Cara lain untuk melihat perbedaannya adalah bahwa data di bidang statistik lain dapat dianggap sebagai sampel iid. Dalam ekonometrik, data dalam banyak kasus merupakan sampel dari proses stokastik, di mana iid hanya merupakan kasus khusus. Karenanya jargon lagi berbeda.

Mengetahui hal di atas biasanya cukup dengan mudah melompat dari bidang statistik lain ke ekonometrik. Karena biasanya model diberikan, tidak sulit untuk mencari tahu apa itu apa. Menurut pendapat pribadi saya, perbedaan jargon antara pembelajaran mesin dan statistik klasik jauh lebih besar daripada antara statistik ekonometrik dan klasik.

Namun perlu dicatat bahwa ada istilah yang memiliki makna berbelit-belit dalam statistik tanpa ekonometrik. Contoh utama adalah efek tetap dan acak. Artikel Wikipedia tentang istilah-istilah ini berantakan, mencampur ekonometrik dengan statistik.

mpiktas
sumber
5
"Contoh utama adalah efek tetap dan acak. Artikel Wikipedia tentang istilah ini berantakan, mencampur ekonometrik dengan statistik." Benar sekali.
Michael Bishop
8

Satu perbedaan halus adalah bahwa ekonom kadang-kadang menganggap makna istilah kesalahan dalam model. Ini terutama benar di kalangan ekonom "struktural" yang percaya bahwa Anda dapat memperkirakan parameter struktural yang mewakili minat atau heterogenitas individu.

Contoh kelas ini adalah probit. Sementara ahli statistik umumnya agnostik tentang apa yang menyebabkan istilah kesalahan, ekonom sering melihat istilah kesalahan dalam regresi sebagai mewakili heterogenitas preferensi. Untuk kasus probit, Anda dapat mencontoh keputusan seorang wanita untuk bergabung dengan angkatan kerja. Ini akan ditentukan oleh berbagai variabel, tetapi istilah kesalahan akan mewakili tingkat yang tidak teramati di mana preferensi individu untuk pekerjaan dapat bervariasi.

d_a_c321
sumber
4
Sementara ahli statistik mungkin agnostik tentang apa yang menyebabkan istilah kesalahan, itu tidak berarti bahwa mereka tidak peduli tentang hal itu. Apa yang Anda uraikan adalah heterogenitas istilah kesalahan, yang berarti bahwa asumsi umum tentang istilah kesalahan tidak terpenuhi. Tidak ada ahli statistik yang akan mengabaikan itu.
mpiktas
2
Menariknya, dalam hal ini, tidak ada masalah dengan bentuk istilah kesalahan. Para ahli statistik dan ekonom sama-sama akan bangkit dan khawatir tentang heteroskedastisitas atau istilah-istilah kesalahan non-iid lainnya. Namun, bahkan jika istilah kesalahannya adalah N (0,1) seperti dalam suatu probit, para ekonom cenderung memberikan interpretasi ekonomi.
d_a_c321
5
Itu berlaku untuk pemodelan secara umum. Menafsirkan model dengan cara khusus Anda sendiri tidak terbatas pada ekonom, sejauh pengalaman saya.
mpiktas
Saya tidak setuju. Ekonom jelas memiliki monopoli interpretasi cerdas model <just kidding!>. Poin yang bagus.
d_a_c321
8

Tentu saja, pernyataan luas apa pun pasti terlalu luas. Tetapi pengalaman saya adalah bahwa ekonometrik memperhatikan hubungan sebab akibat dan statistik menjadi lebih tertarik pada prediksi.

Di sisi ekonomi, Anda tidak dapat menghindari literatur "revolusi kredibilitas" ( Mostly Harmless Econometrics , dll). Ekonom fokus pada dampak dari beberapa perlakuan pada beberapa hasil dengan memperhatikan evaluasi dan rekomendasi kebijakan.

Di sisi statistik, Anda melihat munculnya penambangan data / pembelajaran mesin dengan aplikasi untuk analisis online dan genetika menjadi contoh penting. Di sini, para peneliti lebih tertarik untuk memprediksi perilaku atau hubungan, daripada menjelaskannya dengan tepat; mereka mencari pola, bukan sebab.

Saya juga akan menyebutkan bahwa ahli statistik secara tradisional lebih tertarik pada desain eksperimental, kembali ke eksperimen pertanian pada 1930-an.

Charlie
sumber
7

Saya telah memperhatikan bahwa dibandingkan dengan apa yang saya sebut ilmu statistik arus utama, para ahli ekonometrika tampaknya enggan menggunakan grafik, baik berdasarkan skema maupun data. Cakupan regresi, yang secara alami bahkan lebih sentral dalam ekonometrik daripada di tempat lain, adalah kasus utama. Pengantar modern untuk regresi oleh ahli statistik menekankan seluruh nilai memplot data dan memplot hasil regresi, termasuk plot diagnostik, sedangkan pengobatan dalam teks ekonometrik jelas lebih formal. Teks-teks terkemuka dalam ekonometrik tidak menyertakan banyak grafik dan tidak mempromosikan nilainya dengan kuat.

Sulit untuk menganalisis ini tanpa risiko tampak tidakiplomatik atau lebih buruk, tetapi saya kira beberapa kombinasi berikut ini sebagai kontribusi.

  1. Keinginan untuk ketelitian. Ahli ekonometrika cenderung curiga atau memusuhi belajar dari data dan sangat suka keputusan didasarkan pada tes formal (setiap kali mereka tidak keluar dari teorema). Ini terkait dengan preferensi untuk model yang didasarkan pada "teori" (meskipun ini dapat berarti bahwa prediktor disebutkan sebelumnya dalam makalah oleh beberapa ekonom yang tidak berbicara tentang data).

  2. Praktik publikasi. Makalah untuk jurnal ekonomi atau ekonometrika sarat dengan tabel koefisien yang sangat bergaya, kesalahan standar, t-statistik dan nilai-P. Menambahkan grafik bahkan tampaknya tidak dipikirkan dalam banyak kasus dan jika ditawarkan mungkin disarankan untuk memotong oleh pengulas. Praktik-praktik ini telah menjadi tertanam selama satu generasi atau lebih sejauh mereka telah menjadi otomatis, dengan konvensi yang kaku mengenai tingkat signifikansi, dll.

  3. Grafik untuk model yang kompleks. Grafik diam-diam diabaikan setiap kali tidak tampak seolah-olah ada grafik yang cocok dengan model yang kompleks dengan banyak prediktor, dll., Dll. (Yang memang seringkali sulit untuk diputuskan).

Secara alami, apa yang saya sarankan adalah perbedaan cara, dan saya mengenali banyak variabilitas dalam kedua kasus tersebut.

Nick Cox
sumber
4

Tidak seperti kebanyakan disiplin ilmu kuantitatif lainnya, ekonomi berurusan dengan hal-hal di MARGIN. Yaitu, utilitas marjinal, tingkat substitusi marjinal, dll. Dalam istilah kalkulus, ekonomi berkaitan dengan "pertama" (dan turunan orde tinggi).

Banyak disiplin statistik berurusan dengan kuantitas non-derivatif seperti sarana dan varian. Tentu saja, Anda dapat masuk ke bidang distribusi probabilitas marjinal dan bersyarat, tetapi beberapa aplikasi ini juga masuk ke bidang ekonomi (misalnya "nilai yang diharapkan.")

Tom Au
sumber
2

Ini bukan ekonometrika, itu adalah konteks. Jika fungsi kemungkinan Anda tidak memiliki optimal unik, itu akan menjadi perhatian ahli statistik dan ahli ekonometrika. Sekarang jika Anda mengusulkan asumsi yang berasal dari teori ekonomi dan membatasi parametrization sehingga parameter diidentifikasi, itu bisa disebut ekonometrik, tetapi asumsi itu bisa berasal dari bidang substantif apa pun.

Eksogeneitas adalah masalah filosofis. Lihat misalnya http://andrewgelman.com/2009/07/disputes_about/ untuk perbandingan pandangan yang berbeda, di mana para ekonom biasanya memahaminya seperti yang dilakukan Rubin.

Jadi, singkatnya, baik mengadopsi jargon yang digunakan guru Anda, atau tetap berpikiran terbuka dan membaca secara luas.

Alex
sumber
2

Ekonometris hampir secara eksklusif tertarik pada inferensial kausal, sedangkan ahli statistik juga menggunakan model untuk memprediksi hasil. Akibatnya, ahli ekonometrika lebih fokus pada eksogenitas (seperti yang telah disebutkan orang lain). Pengurangan bentuk ekonometrika dan struktural ekonometrik mendapatkan interpretasi kausal ini dengan cara yang berbeda.

Pengurangan bentuk ekonometrika sering berurusan dengan eksogenitas menggunakan teknik variabel instrumental (sedangkan IV lebih jarang digunakan oleh ahli statistik.)

Ekonometrik struktural mendapatkan interpretasi kausal dari parameter dengan mengandalkan sejumlah teori yang jarang dalam pekerjaan oleh ahli statistik.

DanB
sumber
1
IV banyak digunakan oleh non-ahli statistik, dan ekonometrik bentuk tereduksi menggunakan banyak teknik untuk inferensial kausal selain dari hanya IV (diff-in-diff, diskontinuitas regresi, dll.). Lihat makalah ini oleh Imbens untuk rekonsiliasi ekonometrik IV dengan perkembangan statistik IV non-ekonometrik terkini.
Ari B. Friedman
2

Sebagai ahli statistik saya memikirkan hal ini secara lebih umum. Kami memiliki biometrik dan ekonometrik. Ini adalah kedua area di mana statistik digunakan untuk menyelesaikan masalah. Dengan biometrik kita berhadapan dengan masalah biologis / medis sedangkan ekonometrik berurusan dengan ekonomi. Kalau tidak, mereka akan sama kecuali bahwa disiplin ilmu yang berbeda menekankan teknik statistik yang berbeda. Dalam analisis biometrik survival dan analisis tabel kontingensi banyak digunakan. Untuk econometrics time series banyak digunakan. Analisis regresi adalah umum untuk keduanya. Setelah melihat jawaban tentang perbedaan terminologi antara economatrics dan biostatistik, tampaknya pertanyaan sebenarnya terutama tentang terminologi dan saya benar-benar hanya membahas dua lainnya. Jawabannya sangat bagus sehingga saya tidak bisa menambahkan apa pun padanya. Saya sangat menyukai jawaban StasK. Tetapi sebagai seorang biostatistik saya berpikir bahwa kita menggunakan model logit dan model logistik secara bergantian. Kami memang memanggil log (p / [1-p]) transformasi logit.

Michael Chernick
sumber
2
(+1) Anda dapat menambahkan psikometrik ke daftar aplikasi spesifik domain dari statistik yang diterapkan ke masalah khusus domain.
Andy W