Bagaimana cara mewakili variabel perbedaan dengan benar di DAG?

8

Jika saya tertarik pada efek sebab akibat dari perubahan dalam suatu variabel (E) pada beberapa hasil (O), bagaimana saya menyatakan bahwa dalam grafik asiklik terarah (DAG)?

Seharusnya ΔE2=E2E1dimana E1 & E2 terjadi pada waktu 1 & 2, apakah DAG yang benar adalah:

1. Dengan asumsi itu ΔE2 hanya ditangkap oleh semua tingkatan E1 dan E2( ala cara efek interaksi yang sama begitu ditangkap)?



2. Dengan asumsi itu ΔE2 adalah variabel sebab akibat yang berbeda E1 dan E2, tetapi membutuhkan keberadaan variabel-variabel tersebut?



3. Dengan asumsi itu ΔE2 independen dari E1 & E2 dan yang terakhir tidak perlu untuk mewakili efek dari ΔE2?


  1. Sesuatu yang lain

CATATAN: " DAG " tidak berarti "jenis grafik sebab akibat atau korelasional," tetapi formalisme yang dilarang keras mewakili kepercayaan kausal.


Motivasi saya adalah saya mencoba memikirkan representasi DAG dari model dinamis seperti model koreksi kesalahan umum:

ΔOt=β0+βc(Ot1Et1)+βΔEΔEt+βEEt1+εt

Tentu saja, estimasi parameter mentah dapat ditransformasikan untuk menafsirkan model seperti di bawah ini, jadi mungkin DAGing model di atas akan lebih berantakan?

Efek instan perubahan jangka pendek E di ΔO: βΔE

Efek jangka pendek dari level E di ΔO: βEβcβΔE

Efek ekuilibrium jangka panjang dari lagged E di ΔO: βcβEβc

Alexis
sumber

Jawaban:

4

Solusinya adalah berpikir secara fungsional.

Nilai dari ΔE2=f(E1,E2) lebih spesifikΔE2=E2E1. Oleh karena itu variabel perbedaan dapat direpresentasikan dalam DAG dengan opsi 4, "sesuatu yang lain" (DAG ini mengasumsikanE1 dan E2 langsung menyebabkan O selain perbedaan mereka):

Jika E1 & E2 tidak memiliki efek langsung O, ΔE2 masih tetap menjadi fungsi orang tuanya:

Jika kita menulis ulang model koreksi kesalahan umum jeda tunggal (Qt1 untuk 'istilah eQuilibrium', di mana Qt1=Ot1Et1):

ΔOt=β0+βc(Qt1)+βΔEΔEt+βEEt1+εt

Kemudian DAG yang mendasari model untuk ΔOt (Mengabaikan keturunannya di t+1) adalah:

Efek dari E di ΔOt dari model demikian masuk dari istilah ekuilibrium Qt1dari Et1 dan dari istilah perubahan ΔEt. Penyebab lain dariOt1, Ot, Et1 dan Et (misalnya, variabel yang tidak dimodelkan, input acak) dibiarkan implisit.

Bagian dari jawaban ini sesuai dengan dua DAG pertama adalah milik komunikasi pribadi dengan Miguel Hernán.

Alexis
sumber
1

EDIT:

Jika Anda hanya ingin merepresentasikan hubungan nonparametrik di antara variabel-variabel Anda, saya pikir 1) akan lebih tepat. Meskipun mungkin ada bentuk fungsional yang lebih spesifik yang menghubungkan dua variabel dengan hasil, dalam DAG tidak perlu untuk mewakili formulir itu. Di sisi lain, jika Anda ingin menggunakan diagram jalur yang mewakili model persamaan struktural linier seperti yang Anda tulis, masuk akal untuk memasukkan skor perbedaan dalam diagram; dengan cara ini, model spesifik yang Anda tulis dan diagram akan sama spesifiknya. DAG lebih kabur (tetapi juga lebih fleksibel) karena tidak memerlukan (atau memungkinkan yang diperlukan) untuk bentuk fungsi tertentu.

Mungkin sampai pada tujuan menggambar DAG Anda. Jika tujuan Anda direpresentasikan dengan sebanyak mungkin hubungan di antara variabel-variabel Anda, masuk akal untuk memasukkan istilah perbedaan sebagai variabelnya sendiri karena ia memang memiliki kekuatan kausal sendiri. Grafik tanpa itu juga akan valid. Secara teori, Anda bisa membuat pernyataan independensi bersyarat yang sama tentang hasil dan prediktor dengan DAG yang lebih rinci daripada dengan yang kurang detail.


Intuisi saya paling dekat dengan 3). Jika itu benarE1 dan E2 jangan langsung mempengaruhi O kecuali melalui perbedaan mereka, maka 3) sudah benar, dan saya akan menambahkan tepi dari E1 dan E2 untuk ΔE2 dan dari E1 untuk E2untuk kelengkapan. Tidak ada node lain yang akan menunjuk ke variabel perbedaan, tetapi variabel yang memprediksi perbedaan akan menunjukkan sebaliknyaE1 dan / atau E2. Secara grafis, apa yang saya uraikan adalah:

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

dengan kemungkinan panah tambahan dari E1 dan E2 untuk O jika mereka mempengaruhi O di luar pengaruh mereka melalui perbedaan mereka.

Nuh
sumber
"Jika memang benar bahwa E1 dan E2 tidak secara langsung mempengaruhi O kecuali melalui perbedaan mereka," Kamu tampaknya mengabaikan model yang saya tentukan.
Alexis
Perhatian kedua. Variabel interaksiE1×E2 adalah murni fungsi dari E1 dan E2Namun, variabel tersebut tidak akan direpresentasikan sebagai Anda telah ditarik DAG dalam jawaban Anda , sehingga sama sekali tidak jelas bagi saya bahwa bahkan jika saya sedang tertarik dalam modelΔO=β0+ΔE2+εbahwa DAG Anda akan benar.
Alexis
Itu adalah keprihatinan yang baik. Saya mengabaikan model yang Anda tentukan dan berfokus pada pertanyaan Anda. Apakah Anda ingin menentukan diagram jalur yang mewakili model persamaan struktural linier atau DAG nonparametrik? Jika yang pertama, Anda ingin memasukkan istilah perbedaan sebagai variabelnya sendiri. Kalau tidak, seperti yang Anda sebutkan, akan lebih baik untuk tidak (seperti halnya dengan interaksi). Saya akan merevisi jawaban saya.
Noah
Pertanyaannya tidak ada hubungannya dengan SEM. Anda bisa tahu karena SEM tidak muncul dalam pertanyaan, bahkan sebagai tag. :) Di sisi lain pertanyaan saya adalah semua tentang DAG. :) Juga: mengenai komentar kedua saya "sama sekali tidak jelas" tidak berarti Anda tidak benar ... hanya berarti saya perlu meyakinkan tentang formalisme DAG.
Alexis
1
Jawaban saya mungkin tidak terlalu persuasif, tetapi semoga orang lain dapat melakukan pekerjaan yang lebih baik. Model yang Anda tulis adalah SEM linier, jadi meskipun Anda tidak secara khusus bertanya tentangnya, jika Anda mencoba menghubungkan beberapa jenis diagram lintasan dengan istilah dalam model, Anda berkelana ke wilayah diagram lintasan SEM.
Nuh