Desain survei chi square

8

Adakah yang tahu metode untuk membandingkan dua variabel dengan uji chi square jika variabelnya dari survei yang berbeda dengan svydesign()pernyataan yang berbeda ? Saya mencari untuk menguji perbedaan dalam distribusi variabel di dua gelombang survei, tetapi svychisq()pernyataan tersebut terbatas pada satu objek desain.

Apakah sah untuk menumpuk kedua variabel dalam yang baru data.frame, membuat svydesignpernyataan baru dengan bobot kolektif, lalu menjalankan tes?

david rae
sumber
2
Ini harus dimigrasikan ke situs web stats.SE CrossValidated. Aku akan menunggu untuk itu harus bermigrasi, tetapi mulai membaca ini dalam waktu yang berarti: citeulike.org/user/ctacmo/article/8898414
StasK
@StasK tautan apa saja tanpa paywall?
Anthony Damico
@AnthonyDamico, tanyakan Badan Statistik Kanada: - \. Mungkin di halaman Wu juga.
Tugas
1
Apa yang Anda maksud dengan "membandingkan"? Apakah ini variabel kontinu, variabel ordinal, variabel nominal? Tidak cukup dalam pertanyaan Anda untuk dijawab dengan benar.
Tugas
@StasK, terima kasih atas bantuannya, hanya untuk memperjelas, perbandingan ini untuk variabel ordinal dan kontinu
david rae

Jawaban:

3

Jika Anda akan menyusuri jalur susun kumpulan data, maka Anda harus mendefinisikan super-strata yang sesuai dengan dua set / gelombang data, sehingga svydesign()mengetahui bahwa mereka independen. Dengan demikian baru Anda svydesignakan memiliki strata = lintas tahun dan strata, PSU dari desain asli, dan bobot dari desain asli.

Seperti yang saya sarankan dalam komentar, cara lain untuk menggabungkan perkiraan dan tes telah diusulkan dalam literatur. Wu (2004) menggunakan kemungkinan empiris berdasarkan variabel umum antara dua set data.

Untuk variabel kontinu, idealnya, Anda ingin menggunakan uji Kolmogorov-Smirnov dengan data "flat", tapi saya tidak tahu apakah ekstensi untuknya berfungsi untuk data survei; Aku meragukan itu. Jadi, Anda mungkin harus mengubah variabel kontinu menjadi variabel ordinal menjadi katakan[catatan2(n)] kelompok persentil atau tempat sampah dengan lebar yang sama dari rentang variabel (di mana fungsi ukuran sampel di atas adalah jumlah tempat sampah yang umum digunakan untuk histogram), dan menerapkan Rao-Scott χ2 ke mereka.

Tugas
sumber