Apakah valid untuk memasukkan ukuran dasar sebagai variabel kontrol ketika menguji pengaruh variabel independen terhadap skor perubahan?

38

Saya mencoba menjalankan regresi OLS:

  • DV: Perubahan berat badan lebih dari setahun (berat awal - berat akhir)

  • IV: Apakah Anda berolahraga atau tidak.

Namun, tampaknya masuk akal bahwa orang yang lebih berat akan menurunkan lebih banyak berat badan per unit olahraga daripada orang yang lebih kurus. Jadi, saya ingin memasukkan variabel kontrol:

  • CV: Berat awal awal.

Namun, sekarang bobot awal digunakan KEDUA untuk menghitung variabel dependen DAN sebagai variabel kontrol.

Apakah ini baik? Apakah ini melanggar asumsi OLS?

ChrisStata
sumber
4
Apakah perawatan diberikan secara acak?
Andy W
1
Perhatikan bahwa lain yang sangat mirip baru-baru ini juga diminta, stats.stackexchange.com/q/15104/1036 . Jawaban untuk pertanyaan itu berlaku untuk pertanyaan ini (pada kenyataannya, saya akan mengatakan itu adalah pertanyaan rangkap).
Andy W
3
@Andy Sebenarnya, kedua pertanyaan itu cukup berbeda sehingga saya akan memberikan jawaban yang berbeda untuk yang satu ini daripada yang saya berikan kepada yang lain. Charlie sudah memberikan analisis yang bagus di sini.
whuber
3
Perhatikan bahwa menggunakan skor perbedaan biasanya dikaitkan dengan penurunan besar dalam keandalan, meskipun ini agak diperdebatkan
Behacad

Jawaban:

25

Untuk menjawab pertanyaan literal Anda, "Apakah valid untuk memasukkan ukuran dasar sebagai variabel kontrol ketika menguji pengaruh variabel independen pada skor perubahan?", Jawabannya adalah tidak . Jawabannya adalah tidak, karena dengan konstruksi skor baseline berkorelasi dengan istilah kesalahan ketika skor perubahan digunakan sebagai variabel dependen, maka efek estimasi baseline terhadap skor perubahan tidak dapat diinterpretasikan.

Menggunakan

  • Y1 sebagai bobot awal
  • Y2 sebagai bobot akhir
  • Δ Y = Y 2 - Y 1ΔY sebagai perubahan berat (yaitu )ΔY=Y2-Y1
  • T sebagai pengobatan yang ditugaskan secara acak , dan
  • X sebagai faktor eksogen lain yang mempengaruhi berat badan (misalnya variabel kontrol lain yang terkait dengan hasil tetapi harus tidak berkorelasi dengan pengobatan karena penugasan acak)

Satu kemudian memiliki model regresi pada dan ; T XΔYTX

ΔY=β1T+β2X+e

Yang menurut definisi setara dengan;

Y2-Y1=β1T+β2X+e

Sekarang, jika Anda memasukkan garis dasar sebagai kovariat, orang akan melihat masalah, karena Anda memiliki istilah di kedua sisi persamaan. Ini menunjukkan bahwa tidak dapat diinterpretasikan, karena secara inheren berkorelasi dengan istilah kesalahan.β 3 Y 1Y1β3Y1

Y2-Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Sekarang, bagian dari kebingungan dalam berbagai jawaban tampaknya berasal dari kenyataan bahwa model yang berbeda akan menghasilkan hasil yang identik untuk efek pengobatan , dalam formulasi saya di atas. Jadi, jika seseorang membandingkan efek pengobatan untuk model menggunakan skor perubahan sebagai variabel dependen dengan model menggunakan "level" (dengan masing-masing model termasuk garis dasar sebagai kovariat), interpretasi dari efek pengobatan akan menjadi sama. Dalam dua model yang mengikuti akan sama, demikian juga kesimpulan berdasarkan pada mereka (Bruce Weaver memiliki beberapa kode SPSS yang diposting menunjukkan kesetaraan juga).Y 1 β 1 Tβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels MHaidel:Y2=β1T+β2X+β3Y1+e

Jadi beberapa akan berdebat (seperti yang Felix miliki di utas ini, dan seperti yang dilakukan Bruce Weaver pada beberapa diskusi di grup SPSS google) bahwa karena model menghasilkan perkiraan efek pengobatan yang sama, tidak masalah yang mana yang Anda pilih. Saya tidak setuju, karena kovariat awal dalam model skor perubahan tidak dapat diartikan, Anda tidak boleh memasukkan baseline sebagai kovariat (terlepas dari apakah efek pengobatan yang diperkirakan sama atau tidak). Jadi ini memunculkan pertanyaan lain, apa gunanya menggunakan skor perubahan sebagai variabel dependen? Seperti yang telah dicatat Felix juga, model yang menggunakan skor perubahan sebagai variabel dependen tidak termasuk baseline sebagai kovariat berbeda dari model yang menggunakan level. Untuk memperjelas, model-model selanjutnya akan memberikan efek pengobatan yang berbeda (terutama dalam kasus bahwa perawatan berkorelasi dengan baseline);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Ini telah dicatat dalam literatur sebelumnya sebagai "Paradox Tuhan". Jadi model mana yang benar? Nah, dalam kasus percobaan acak, saya akan mengatakan model Levels lebih disukai (meskipun jika Anda melakukan pekerjaan acak yang baik, efek pengobatan rata-rata harus sangat dekat antara model). Yang lain telah mencatat alasan mengapa model level lebih disukai, jawaban Charlie membuat poin yang bagus karena Anda dapat memperkirakan efek interaksi dengan baseline dalam model level (tetapi Anda tidak bisa dalam model skor perubahan). Whuber dalam respons ini untuk pertanyaan yang sangat mirip menunjukkan bagaimana skor perubahan menginduksi korelasi antara perawatan yang berbeda.

Dalam situasi di mana perawatan tidak diberikan secara acak, model yang menggunakan skor perubahan sebagai variabel dependen harus lebih dipertimbangkan. Manfaat utama dari model skor perubahan, adalah bahwa setiap prediktor invarian hasil dikendalikan untuk. Jadi katakanlah dalam formulasi di atas, adalah konstan sepanjang waktu (misalnya mengatakan kecenderungan genetik berada pada berat tertentu), dan bahwa berkorelasi dengan apakah seseorang memilih untuk berolahraga (dan tidak diobservasi). Dalam hal itu, model skor perubahan lebih disukai. Juga dalam kasus di mana pemilihan ke dalam pengobatan berkorelasi dengan nilai awal, model skor perubahan mungkin lebih disukai. Paul Allison dalam makalahnya,X XXXXUbah Skor sebagai Variabel Dependen dalam Analisis Regresi , memberikan contoh yang sama (dan sebagian besar memengaruhi perspektif saya tentang topik tersebut, jadi saya sangat menyarankan untuk membacanya).

Ini bukan untuk mengatakan bahwa skor perubahan selalu lebih baik di pengaturan non-acak. Dalam hal Anda mengharapkan baseline memiliki efek kausal yang sebenarnya pada berat post, Anda harus menggunakan model level. Dalam hal Anda mengharapkan garis dasar memiliki efek kausal, dan pemilihan ke dalam pengobatan berkorelasi dengan garis dasar, efek pengobatan dikacaukan dengan efek garis dasar.

Saya telah mengabaikan catatan oleh Charlie bahwa logaritma bobot dapat digunakan sebagai variabel dependen. Meskipun saya tidak ragu itu bisa menjadi kemungkinan, ini agak tidak berurutan untuk pertanyaan awal. Pertanyaan lain telah dibahas ketika layak untuk menggunakan logaritma variabel (dan mereka masih berlaku dalam kasus ini). Mungkin ada literatur sebelumnya tentang subjek yang akan membantu memandu Anda apakah menggunakan berat badan yang masuk juga tepat.


Kutipan

Allison, Paul D. 1990. Ubah skor sebagai variabel dependen dalam analisis regresi . Metodologi Sosiologis 20: 93-114. Versi PDF publik .

Andy W
sumber
3
Dalam persamaan jika, seperti praktik standar, kami menganggap semua kovariat bukan variabel acak, maka tidak berkorelasi dengan . Jadi saya pikir hanya ada masalah jika Anda melihat sebagai acak, dalam hal ini (sekali lagi hanya pendapat saya) Anda harus memodelkan bersama-sama tetapi tanpa sebagai kovariat. Dalam hal ini tanpa data yang hilang, saya telah diberitahu bahwa pendekatan ini setara dengan sebagai kovariat tetap (saya akan mencoba dan menemukan beberapa referensi untuk ini). Y 1 e + Y 1 Y 1 ( Y 1 , Y 2 )Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y 1Y1Y1
dandar
1
@andar, pernyataan itu tidak masuk akal bagi saya. Perhatikan bahwa adalah nilai pra-perawatan dari hasil , itu bukan variabel yang dimanipulasi dalam percobaan. Apakah Anda mengatakan jika saya memiliki nilai awal , maka saya melakukan percobaan, dan kemudian mengukur , saya harus memodelkan dan sebagai fungsi dari intervensi eksperimental? Y 1 Y 2 Y 1 Y 2Y1Y1Y2Y1Y2
Andy W
1
Model yang saya bicarakan ini memang menyiratkan adalah fungsi pengobatan, tetapi hanya dari sudut pandang bahwa meskipun pengacakan akan selalu ada sedikit perbedaan antara kelompok perlakuan dan kontrol sehubungan dengan cara dasar mereka. Dengan demikian akan menangkap perbedaan ini serta efek dari perawatan. Referensi untuk ini adalah ("Analisis Data Longitudinal Respon Kontinu dan Terpisah untuk Desain Pra-Pasca" oleh Zeger dan Liang, 2000). β 1Y1β1
dandar
1
Diskusi yang jelas dari makalah ini dapat ditemukan di ("Haruskah baseline menjadi variabel kovariat atau dependen dalam analisis perubahan dari awal dalam uji klinis?" Oleh Liu, Mogg, Mallick dan Mehrotra 2009). Mereka menyebut model ini sebagai model tanpa syarat (yaitu tidak mengkondisikan pada respon awal). Dalam makalah Liu (2009) mereka membahas hasil utama dari makalah Zeger (2000). Ini adalah pertama bahwa tanpa data yang hilang, estimasi titik dari model tanpa syarat adalah sama dengan yang dari pendekatan bersyarat ANCOVA menggunakan post-baselineB1
dandar
1
pengukuran sebagai respons, dan mengkondisikan pada nilai dasar tetap, dan kedua bahwa varians estimasi titik dari model ANCOVA selalu lebih besar dari atau sama dengan yang dari yang tidak bersyarat. Ternyata perbedaan varians ini biasanya akan kecil karena pengacakan memastikan tanggapan rata-rata awal antara kelompok-kelompok kecil. Penulis menyimpulkan model tanpa syarat sesuai untuk memodelkan baseline sebagai variabel acak, tetapi ANCOVA sesuai ketika melihatnya sebagai tetap.
dandar
21

Jawaban Andy tampaknya adalah pandangan para ekonom tentang berbagai hal. Ini adalah praktik yang diterima dalam uji klinis untuk hampir selalu menyesuaikan untuk versi awal dari variabel respon, untuk meningkatkan daya. Karena kami mengkondisikan pada variabel dasar tidak ada 'istilah kesalahan' bagi mereka untuk menjadi bingung dengan istilah kesalahan keseluruhan. Satu-satunya masalah adalah jika kesalahan pengukuran dalam kovariat dasar dikacaukan dengan X lain, mendistorsi efek X lainnya. Metode keseluruhan yang disukai adalah untuk menyesuaikan baseline dan untuk memodelkan variabel respons, bukan menghitung perubahan. Salah satu alasan untuk ini adalah bahwa perubahan sangat bergantung pada mendapatkan transformasi Y yang benar, dan perubahan itu tidak berlaku untuk model regresi secara umum. Misalkan jika Y adalah ordinal, perbedaan antara dua variabel ordinal tidak lagi ordinal.

Frank Harrell
sumber
1
Saya tidak sepenuhnya mengerti jawaban ini. Apa yang Anda maksud dengan "sesuaikan dengan baseline"? Ambil perbedaannya, atau kendalikan?
Henrik
3
Dengan 'sesuaikan dengan garis dasar' yang saya maksudkan termasuk garis dasar sebagai kovariat. Juga biasa menggunakan skor perubahan tetapi Anda tidak dapat menggunakannya tanpa juga menyesuaikan baseline sebagai kovariat (karenanya mengapa repot-repot dengan skor perubahan?).
Frank Harrell
6
Sebenarnya tidak ada yang Anda katakan di sini (atau sebagai tanggapan atas komentar Felix) langsung bertentangan dengan apa yang saya katakan. Menggunakan skor perubahan tidak 'menyesuaikan untuk baseline', itu mengontrol untuk setiap variabel terikat waktu (atau jika pemilihan dalam pengobatan sangat berkorelasi dengan baseline). Jika baseline tidak dapat diabaikan (yaitu memiliki efek kausal langsung pada hasil atau memiliki interaksi dengan pengobatan) skor perubahan tidak menyelesaikan masalah.
Andy W
2
@ Frank Harrell Terima kasih telah bergabung dengan diskusi ini dan mengklarifikasi ini. (+1)
Henrik
8

Kita dapat mengubah sedikit alasan @ ocram agar

E[w1-w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

Jadi, jika ini adalah model yang tepat , mengatakan bahwa perbedaannya tergantung pada berat menyiratkan bahwa nilai akhir tergantung pada nilai awal dengan koefisien yang bisa apa saja. Menjalankan regresi perbedaan pada dan atau bobot akhir pada variabel yang sama akan memberi Anda koefisien yang sama pada segala sesuatu kecuali . Tetapi, jika model ini tidak sepenuhnya benar, regresi ini akan memberikan hasil yang berbeda pada koefisien lainnya juga.w 0 w 0xw0w0

Perhatikan bahwa pengaturan ini menyiratkan bahwa berat awal memprediksi perbedaan dalam bobot, bukan dampak pengobatan . Ini membutuhkan istilah interaksi, mungkin

E[w1-w0X,w0]=β0+(xw0)β+w0γ.

Pendekatan lain adalah menghitung sini, adalah tingkat pertumbuhan bobot. Ini bisa jadi hasil Anda. Koefisien Anda pada akan memberi tahu Anda bagaimana prediksi ini terkait dengan perubahan proporsi bobot. Ini "mengontrol" berat awal dengan mengatakan bahwa, misalnya, rezim olahraga yang mengurangi berat badan sebesar 10% (koefisien 0,1 dikalikan dengan 100%) untuk seseorang yang bobotnya 130 pon mengurangi berat sebanyak 13 pon, sementara program mengurangi berat peserta 200 pon dengan 20 pon. Dalam hal ini, Anda mungkin tidak perlu memasukkan bobot awal (atau log-nya) di sisi kanan.rx

log(w1)-log(w0)r;
rx

Istilah interaksi mungkin masih diperlukan jika Anda yakin bahwa dampak program tergantung pada bobot awal. Jika Anda menggunakan dalam istilah interaksi, maka program akan dikaitkan dengan perubahan dalam tingkat pertumbuhan berat. Setiap pon lebih berat dari seseorang pada awal program menyebabkan peningkatan dalam perubahan dalam tingkat pertumbuhan (ini adalah turunan lintas-parsial dari nilai yang diharapkan sehubungan dengan pengobatan dan berat mulai).w 0 β 1 β 1w0w0β1β1

Jika Anda menggunakan dalam istilah interaksi, dampak program meningkat sebesar untuk setiap pound tambahan yang lebih berat peserta berada di awal program.β 1 / w 0log(w0)β1/w0

Seperti yang Anda lihat, cross-parsial pada istilah interaksi bisa menjadi agak sulit untuk ditafsirkan, tetapi mereka mungkin menangkap dampak yang Anda minati.

Charlie
sumber
Hai Charlie, saya melihat keuntungan menggunakan perubahan proporsi, namun mengapa Anda menemukan perbedaan dalam variabel yang dicatat sebagai lawan hanya membagi w1 lebih dari w0.
ChrisStata
Saya suka ide perubahan proporsional. Namun pertanyaannya tetap apakah interaksi yang diharapkan secara proporsional atau tidak. Jika tidak, Anda masih perlu memasukkan berat awal sebagai kovariat. Atau apakah Anda yakin bahwa itu adalah kesulitan yang sama untuk kehilangan 10% dari berat badan Anda untuk 100 atau 200 pound orang ??
Henrik
@ ChrisStata, Anda bisa melakukannya juga. Saya seorang ekonom dan kami sangat menyukai log kami (dan juga berbeda). Jika Anda memiliki deret waktu (yaitu, pengamatan ganda) untuk setiap orang (membuat set data panel), saya bisa berpendapat bahwa cara saya lebih baik, tetapi itu tidak relevan di sini. Henrik, kamu benar; Saya menambahkan sedikit tentang itu ke jawaban saya.
Charlie
8

EDIT: Argumen Andy W meyakinkan saya untuk menjatuhkan Model C. Saya menambahkan kemungkinan lain: Menganalisis perubahan dengan Model Koefisien Acak (alias Model Bertingkat atau Model Efek Campuran)

Ada banyak perdebatan ilmiah tentang penggunaan skor perbedaan. Teks favorit saya adalah Rogosa (1982, [1]) dan Fitzmaurice, Laird, & Ware (2004, [2])

Secara umum, Anda memiliki tiga kemungkinan untuk menganalisis data Anda:

  • A) Hanya ambil skor perbedaan antar individu (skor perubahan)
  • B) Perlakukan pengukuran pos sebagai DV dan kontrol untuk baseline
  • C) Ambil skor perbedaan sebagai DV dan kendalikan untuk baseline (itulah model yang Anda sarankan). Karena argumen Andy W, saya menjatuhkan alternatif ini
  • D) Menggunakan pendekatan multilevel / efek campuran, di mana garis regresi dimodelkan untuk setiap peserta dan peserta diperlakukan sebagai unit Level-2.

Model A dan B dapat menghasilkan hasil yang sangat berbeda jika garis dasar berkorelasi dengan skor perubahan (misalnya, orang yang lebih berat memiliki lebih banyak penurunan berat badan), dan / atau penugasan pengobatan berkorelasi dengan garis dasar.

Jika Anda ingin tahu lebih banyak tentang masalah ini, lihat makalah yang dikutip, atau di sini dan di sini .

Ada juga studi simulasi terbaru [3] yang secara empiris membandingkan kondisi di mana A atau B lebih disukai.

Untuk desain yang benar-benar seimbang tanpa nilai yang hilang, Model D harus setara dengan Model A. Namun, ini memberi Anda informasi lebih lanjut tentang variabilitas orang, mudah diperluas ke titik pengukuran yang lebih banyak, dan memiliki sifat yang bagus di hadapan data yang tidak seimbang dan / atau nilai yang hilang.

Sebagai garis bawah: Dalam kasus Anda, saya akan menganalisis langkah-langkah yang dikontrol untuk baseline (Model B).

[1] Rogosa, D., Brandt, D., & Zimowski, M. (1982). Pendekatan kurva pertumbuhan untuk pengukuran perubahan. Buletin Psikologis, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM, & Ware, JH (2004). Analisis longitudinal yang diterapkan. Hoboken, NJ: Wiley.

[3] Petscher, Y., & Schatschneider, C., 2011. Studi Simulasi tentang Kinerja Perbedaan Sederhana dan Skor Kovarians yang Disesuaikan dalam Desain Eksperimental Acak. Jurnal Pengukuran Pendidikan, 48, 31-43.

Felix S
sumber
Saya telah menurunkan jawaban ini, dan Anda dapat melihat respons saya mengapa saya percaya skor perubahan dengan nilai dasar sebagai kovariat tidak boleh dilakukan. Singkatnya, meskipun Model B dan C dalam formulasi Anda menghasilkan efek pengobatan yang setara, itu tidak berarti bahwa Model C lebih disukai. Faktanya, efek baseline pada Model C tidak dapat diinterpretasikan, jadi saya berpendapat ini tidak boleh digunakan.
Andy W
@AndyW: Argumen Anda meyakinkan saya; walaupun perkiraan efek pengobatan yang paling relevan adalah sama di kedua model, Model B harus lebih disukai daripada Model C. Saya menyesuaikan jawaban saya. Tapi apa yang Anda katakan Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.?, Siapa yang menunjukkan kesetaraan B dan C?
Felix S
b¯b¯
Satu poin untuk model D. Saya bertanya-tanya mengapa tidak hanya mempertimbangkan model D. Ini adalah yang paling konsisten (nilai dasar adalah variabel acak dan belum dipaksa ke variabel dependen), sederhana, sangat fleksibel (interaksi dapat ditambahkan) dan memberikan juga standar deviasi populasi.
giordano
3

Glymour et al. (2005) ditangani dengan menggunakan penyesuaian baseline ketika menganalisis skor perubahan. Jika perubahan status kesehatan mendahului penilaian awal atau ada kesalahan pengukuran besar dalam variabel dependen, mereka menemukan bahwa bias dapat muncul jika model regresi menggunakan skor perubahan sebagai variabel dependen termasuk kovariat baseline. Jawaban Frank Harrell "Satu-satunya masalah adalah jika kesalahan pengukuran dalam kovariat awal dikacaukan dengan X lain, mendistorsi efek X lainnya." mungkin mencerminkan bias yang sama dengan alamat Glymour.

Glymour (2005) "Kapan Penyesuaian Dasar Berguna dalam Analisis Perubahan? Contoh dengan Pendidikan dan Perubahan Kognitif. American Journal of Epidemiology 162: 267-278

David Svendsgaard
sumber
1

Ocram tidak benar. Perbedaan bobot tidak memperhitungkan bobot awal. Secara khusus, berat awal adalah jenis yang diambil dengan mengurangi berat akhir dari itu.

Oleh karena itu, saya berpendapat bahwa itu tidak melanggar asumsi jika Anda mengontrol berat awal.

(Logika yang sama berlaku jika Anda mengambil perbedaan BMI dan BMI awal.)


Pembaruan
Setelah kritik Andy W membuat saya lebih formal tentang mengapa saya benar dan Ocram salah (setidaknya dari sudut pandang saya).

Sebuahw
sayaw=Sebuahwew=Sebuahw+Δw

Δw=sayaw-ew=Sebuahw-Sebuahw+Δw=Δw

Sebuahw

Jika Anda ingin memperhitungkannya, Anda perlu memasukkannya ke dalam model Anda secara terpisah (sebagai parameter biasa dan / atau sebagai istilah interaksi).

ΔBM.Jew=SebuahwhalrHaihalΔw

Henrik
sumber
Ketika saya mengatakan bahwa perbedaannya memperhitungkan bobot awal, inilah yang sebenarnya saya maksudkan. Sekarang, secara spesifik, apa yang akan Anda tulis? bobot akhir - bobot awal = ...?
ocram
Seperti yang saya tulis, argumentasi Anda tampaknya salah bagi saya. Saya berpendapat bahwa sebenarnya bobot akhir lebih mempertimbangkan bobot awal karena berada pada "skala" yang sama, sedangkan perbedaannya "diubah kembali" (sebagai bobot akhir, maka beberapa nilai absolut dikurangkan dari nilai absoulte yang lain) .
Henrik
(-1) Ini tidak benar. Secara umum, Anda tidak harus memasukkan variabel yang sama di kedua sisi kanan dan sisi kiri persamaan (karena menghasilkan variabel independen yang berkorelasi dengan istilah kesalahan). Jadi, jika Anda menggunakan perbedaan untuk variabel dependen, Anda tidak harus memasukkan baseline sebagai kovariat.
Andy W
@Andy W: Saya tahu bahwa argumen Anda pada prinsipnya benar. Tetapi argumen saya adalah bahwa Anda agak memilah-milah nilai absolut (dengan mengurangi nilai akhir dengan baseline) sehingga menghilangkan korelasi ini. Oleh karena itu, menambahkannya sebagai kovariat tidak memperkenalkan korelasi kesalahan palsu semacam itu.
Henrik
@ Henrik, lihat jawaban saya untuk pertanyaan ini, dan mengapa saya masih percaya sentimen ini salah arah.
Andy W
0

Perhatikan itu

berat badan-berat awalY=β0+βTx

setara dengan

berat badan=berat awal+β0+βTx

Dengan kata lain, menggunakan perubahan berat (bukan berat akhir itu sendiri) sebagai DV sudah memperhitungkan berat awal.

okram
sumber
1
Tapi saya kira mungkin ada interaksi antara berat awal dan penurunan berat badan yang diberikan pelatihan. Katakanlah orang dewasa dengan tinggi 1,90 m dan berat badan 70 kg dan orang dewasa dengan tinggi 1,60 m dan berat badan 90 kg ikut serta dalam latihan yang sama. Saya berani bertaruh bahwa yang terakhir kehilangan lebih banyak berat badan. Jika dipikir-pikir lagi, mungkin indeks massa tubuh adalah CV yang lebih baik daripada hanya berat badan.
xmjx
1
@xmjx: Jika Anda berpikir bahwa bobot awal akan berdampak pada bobot akhir - dan Anda mungkin benar - maka itu ide yang baik untuk memperkenalkannya sebagai penyeimbang dalam model seperti yang dilakukan di sini ...
ocram
3
Secara umum tidak benar. Jika kemiringan bobot dasar bukan 1,0 maka analisis perubahan tidak akan setara dengan analisis bobot akhir kecuali bobot awal ada di kedua model dan Anda menggunakan regresi biasa. Jika bobot dasar ada di dua tempat, model tersebut sebenarnya lebih sulit dijelaskan, sehingga alasan untuk bertahan dengan pendekatan ini tidak jelas.
Frank Harrell