Penggunaan yang tepat dan interpretasi model gamma nol-inflasi

11

Latar Belakang: Saya seorang ahli biostatistik yang saat ini bergulat dengan dataset tingkat ekspresi seluler. Penelitian ini mengekspos sejumlah sel, dikumpulkan dalam kelompok dari berbagai donor, ke peptida tertentu. Sel mengekspresikan biomarker tertentu sebagai respons, atau tidak. Tingkat respons kemudian dicatat untuk setiap kelompok donor. Tingkat respons (dinyatakan sebagai persentase) adalah hasil yang menarik, dan paparan peptida adalah prediktornya.

Perhatikan bahwa pengamatan dikelompokkan dalam donor.

Karena saya hanya memiliki data ringkasan, saya memperlakukan tingkat respons yang bijaksana dari donor sebagai data yang berkelanjutan (setidaknya untuk saat ini).

Komplikasi muncul dari kenyataan bahwa saya memiliki banyak nol dalam data saya. Terlalu banyak untuk diabaikan. Saya sedang mempertimbangkan model gamma nol-meningkat untuk menangani fakta bahwa saya telah condong data kontinu ditambah dengan melimpahnya angka nol. Saya juga mempertimbangkan model Tobit, tetapi ini tampaknya lebih rendah karena mengasumsikan sensor pada batas bawah, yang bertentangan dengan nol asli (ahli ekonometrika mungkin mengatakan perbedaannya diperdebatkan).

Pertanyaan: Secara umum, kapan tepat menggunakan model gamma nol-inflasi? Artinya, apa saja asumsinya? Dan bagaimana seseorang mengartikan kesimpulannya? Saya akan berterima kasih atas tautan ke makalah yang membahas ini, jika Anda punya.

Saya telah menemukan tautan pada SAS-L di mana Dale McLerran memberikan kode NLMIXED untuk model gamma nol-inflasi, sehingga tampaknya memungkinkan. Meskipun demikian, saya akan benci untuk menyerang balik secara membabi buta.

Brenden Dufault
sumber

Jawaban:

5

Pertama, Anda tidak melihat nol asli dalam data ekspresi. Ahli biologi Anda mengatakan itu, seperti yang dilakukan semua ahli biologi, tetapi ketika seorang ahli biologi mengatakan "itu nol" itu sebenarnya berarti "itu di bawah ambang deteksi saya, jadi itu tidak ada." Ini masalah bahasa karena kurangnya kecanggihan matematika di lapangan. Saya berbicara dari pengalaman pribadi di sini.

Penjelasan tentang nol Gamma yang meningkat di tautan yang Anda berikan sangat bagus. Proses fisik yang mengarah ke data Anda adalah, jika saya memahaminya, seorang donor dipilih, kemudian dirawat dengan peptida tertentu, dan responsnya diukur dari sel-sel donor itu. Ada beberapa lapisan di sini. Salah satunya adalah kekuatan keseluruhan respons donor, yang dimasukkan ke dalam tingkat ekspresi setiap sel tertentu yang diukur. Jika Anda mengartikan variabel Bernoulli Anda dalam Gamma nol yang dipompa sebagai "respons donor cukup kuat untuk diukur", maka itu mungkin baik-baik saja. Harap perhatikan bahwa dalam hal ini Anda menyamakan suara ekspresi sel individu dengan variasi antara donor yang merespons dengan kuat. Karena noise dalam ekspresi dalam sel tunggal kira-kira terdistribusi gamma,

Jika variasi tambahan dari donor vs sel tidak mengacaukan kecocokan Gamma Anda, dan Anda hanya mencoba untuk mendapatkan ekspresi vs peptida terapan, maka tidak ada alasan mengapa ini tidak boleh apa-apa.

Jika analisis yang lebih rinci dilakukan, maka saya akan merekomendasikan membangun model hierarkis khusus agar sesuai dengan proses yang mengarah ke pengukuran Anda.

pengguna873
sumber
3

Saya telah menemukan solusi yang menurut saya agak elegan. Ada artikel yang sangat baik dalam literatur yang berjudul "Analisis data tindakan berulang dengan menggumpal di nol" yang menunjukkan model lognormal nol-meningkat untuk data berkorelasi. Para penulis memberikan makro SAS yang didasarkan pada PROC NLMIXED dan cukup mudah diimplementasikan. Kabar baiknya adalah bahwa hal ini dapat disederhanakan menjadi kasus tanpa observasi berkerumun dengan menghilangkan repeatedpernyataan di makro. Berita buruknya adalah bahwa NLMIXED belum memiliki banyak struktur korelasi yang sering kita butuhkan, seperti autoregresif.

Makro bernama MIXCORR, dan memiliki halaman Wiki yang sangat berguna yang dapat Anda temukan di sini . Makro itu sendiri dapat diunduh di sini .

Saya sangat merekomendasikan semua tautan ini. Semoga Anda menemukan mereka menjadi berguna.

Brenden Dufault
sumber