Seorang penyelidik ingin menghasilkan analisis gabungan dari beberapa dataset. Dalam beberapa dataset ada pengamatan berpasangan untuk pengobatan A dan B. Di lain dataset ada data A dan / atau B tidak berpasangan. Saya mencari referensi untuk adaptasi uji-t, atau untuk uji rasio kemungkinan, untuk data yang dipasangkan sebagian. Saya bersedia (untuk saat ini) untuk menganggap normalitas dengan varians yang sama dan bahwa rata-rata populasi untuk A adalah sama untuk setiap studi (dan juga untuk B).
hypothesis-testing
t-test
paired-data
change-scores
Frank Harrell
sumber
sumber
Jawaban:
Guo dan Yuan menyarankan metode alternatif yang disebut uji-t gabungan optimal yang berasal dari uji-t gabungan Samawi dan Vogel.
Tautan ke referensi: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.865.734&rep=rep1&type=pdf
Sangat bagus dibaca dengan beberapa opsi untuk situasi ini
Baru mengomentari, jadi beri tahu saya jika saya perlu menambahkan yang lain.
sumber
Nah, jika Anda tahu varians dalam pasangan berpasangan dan dalam pasangan (yang umumnya akan jauh lebih kecil), bobot optimal untuk dua perkiraan perbedaan dalam kelompok berarti bobot bobot berbanding terbalik dengan varians individu. estimasi perbedaan rata-rata.
[Sunting: ternyata ketika varians diperkirakan, ini disebut penaksir Graybill-Deal. Ada beberapa makalah tentang itu. Ini satu]
Kebutuhan untuk memperkirakan varians menyebabkan beberapa kesulitan (rasio yang dihasilkan estimasi varians adalah F, dan saya pikir bobot yang dihasilkan memiliki distribusi beta, dan statistik yang dihasilkan agak rumit), tetapi karena Anda sedang mempertimbangkan bootstrap, ini mungkin kurang menjadi perhatian.
Kemungkinan alternatif yang mungkin lebih baik dalam beberapa hal (atau setidaknya sedikit lebih kuat untuk non-normal, karena kami bermain dengan rasio varians) dengan sangat sedikit kerugian dalam efisiensi pada normal adalah untuk mendasarkan estimasi gabungan dari pergeseran tes peringkat berpasangan dan tidak berpasangan - dalam setiap kasus semacam estimasi Hodges-Lehmann, dalam kasus tidak berpasangan berdasarkan median perbedaan sampel berpasangan berpasangan dan dalam kasus berpasangan, median selisih rata-rata berpasangan berpasangan. Sekali lagi, kombinasi linear minimum berbobot varian minimum adalah dengan bobot sebanding dengan inversi varians. Dalam hal ini saya mungkin akan condong ke permutasi (/ pengacakan) daripada bootstrap - tetapi tergantung pada bagaimana Anda menerapkan bootstrap Anda mereka bisa berakhir di tempat yang sama.
Dalam kedua kasus Anda mungkin ingin memperkuat varian Anda / mengecilkan rasio varians Anda. Masuk ke stadion baseball yang tepat untuk berat itu baik, tetapi Anda akan kehilangan sangat sedikit efisiensi pada normal dengan membuatnya sedikit kuat. ---
Beberapa pemikiran tambahan yang belum saya jelaskan cukup jelas di kepala saya sebelumnya:
Masalah ini memiliki kemiripan yang berbeda dengan masalah Behrens-Fisher, tetapi bahkan lebih sulit.
Jika kita memperbaiki bobot, kita bisa memukul dalam pendekatan tipe Welch-Satterthwaite; struktur masalahnya sama.
Masalah kami adalah kami ingin mengoptimalkan bobot, yang secara efektif berarti bobot tidak tetap - dan memang, cenderung memaksimalkan statistik (setidaknya kira-kira dan lebih hampir dalam sampel besar, karena setiap rangkaian bobot adalah kuantitas acak yang memperkirakan jumlah yang sama. pembilang, dan kami berusaha meminimalkan penyebutnya; keduanya tidak independen).
Saya harapkan, ini akan membuat pendekatan chi-square lebih buruk, dan hampir pasti akan mempengaruhi df dari pendekatan yang lebih jauh.
[Jika masalah ini bisa dilakukan, mungkin saja ada aturan praktis yang bisa mengatakan 'Anda bisa melakukan hampir juga jika Anda hanya menggunakan data yang dipasangkan di bawah kondisi-kondisi ini, hanya yang tidak berpasangan di bawah perangkat-perangkat lain ini. kondisi dan sisanya, skema berat badan tetap ini biasanya sangat dekat dengan optimal '- tetapi saya tidak akan menahan nafas menunggu kesempatan itu. Aturan keputusan seperti itu pasti akan berdampak pada signifikansi sebenarnya dalam setiap kasus, tetapi jika efek itu tidak begitu besar, aturan praktis seperti itu akan memberikan cara mudah bagi orang untuk menggunakan perangkat lunak warisan yang ada, sehingga bisa diinginkan untuk cobalah untuk mengidentifikasi aturan seperti itu untuk pengguna dalam situasi seperti itu.]
---
Sunting: Catatan untuk diri sendiri - Perlu kembali dan mengisi rincian pekerjaan pada tes 'tumpang tindih sampel', terutama t-tes sampel yang tumpang tindih
---
Terjadi pada saya bahwa tes pengacakan harus bekerja dengan baik -
di mana data dipasangkan Anda secara acak mengubah label grup dalam pasangan
di mana data tidak berpasangan tetapi dianggap memiliki distribusi umum (di bawah nol), Anda mengizinkan tugas kelompok
Anda sekarang dapat mendasarkan bobot ke dua taksiran shift dari taksiran varians relatif (w1=1/(1+v1v2) ), hitung masing-masing estimasi bobot tertimbang sampel acak dari acak dan lihat di mana sampel masuk ke dalam distribusi pengacakan.
(Ditambahkan jauh kemudian)
Makalah yang mungkin relevan:
Derrick, B., Russ B., Toher, D., dan White, P. (2017),
"Statistik Uji untuk Perbandingan Berarti untuk Dua Sampel Yang Termasuk Baik Pengamatan Berpasangan dan Independen"
Jurnal Metode Statistik Terapan Modern , Mei , Vol. 16, No. 1, 137-157.
doi: 10.22237 / jmasm / 1493597280
http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=2251&context=jmasm
sumber
Inilah beberapa pemikiran. Saya pada dasarnya baru saja sampai pada kesimpulan Greg Snow bahwa masalah ini memiliki kemiripan yang berbeda dengan masalah Behrens-Fisher . Untuk menghindari handwaving, saya pertama kali memperkenalkan beberapa notasi dan memformalkan hipotesis.
setiap pengamatan adalah jumlah dari efek pasien dan efek perawatan. Variabel acak yang sesuai adalah
Langkah alami selanjutnya adalah mempertimbangkan
Pada titik ini saya pikir seseorang dapat plug-in solusi yang diusulkan untuk masalah Behrens Fisher untuk mendapatkan solusi untuk masalah Anda.
sumber
Pikiran pertama saya adalah model efek campuran, tapi itu sudah dibahas jadi saya tidak akan mengatakan itu lagi.
Pikiran saya yang lain adalah bahwa jika secara teori dimungkinkan bahwa Anda bisa mengukur data berpasangan pada semua mata pelajaran tetapi karena biaya, kesalahan, atau alasan lain Anda tidak memiliki semua pasangan, maka Anda bisa memperlakukan efek yang tidak terukur untuk subjek yang tidak berpasangan sebagai data yang hilang dan menggunakan alat-alat seperti algoritma EM atau Multiple Imputation (hilang secara acak tampaknya masuk akal kecuali alasan subjek hanya diukur di bawah 1 perawatan terkait dengan apa hasil mereka akan berada di bawah perlakuan lainnya).
Bahkan mungkin lebih sederhana untuk menyesuaikan bivariat normal dengan data menggunakan kemungkinan maksimum (dengan kemungkinan berdasarkan faktor data yang tersedia per subjek), kemudian lakukan uji rasio kemungkinan membandingkan distribusi dengan rata-rata sama dengan sarana berbeda.
Sudah lama sejak kelas teori saya, jadi saya tidak tahu bagaimana ini membandingkan pada optimalitas.
sumber
mungkin pemodelan campuran dengan pasien sebagai efek acak bisa menjadi cara. Dengan pemodelan campuran, struktur korelasi dalam kasus berpasangan dan kehilangan sebagian dalam kasus tidak berpasangan dapat dipertanggungjawabkan.
sumber
gls
fungsi R dalamnlme4
paket.Salah satu metode yang diusulkan dalam Hani M. Samawi & Robert Vogel (Jurnal Statistik Terapan, 2013) terdiri dari kombinasi bobot skor-T dari sampel independen dan dependen sedemikian rupa sehingga skor T baru sama dengan
sumber