Rata-rata rata-rata (rata-rata, rata-rata ...)

8

Pertimbangkan percobaan biologi sel berikut. Kami membandingkan berbeda perawatan sel yang dikultur. Setiap perlakuan direplikasi dalam beberapa sumur (mikrotiter) , diindeks oleh variabel . Untuk mengukur respon terhadap pengobatan dalam baik w , total F_w non-tumpang tindih mikrograf, atau bidang , dicatat. Kemudian, untuk setiap bidang f dalam sumur w , total sel C_ {wf} diidentifikasi secara komputasi, dimana setiap sel c (dalam sumur w , bidang f ) diwakili oleh seperangkatTtw{1,2,,W}wFwfwCwfcwfPwfc piksel. Akhirnya, terkait dengan setiap piksel p adalah pengukuran xwfcp (berasal dari intensitas berbagai sinyal fluoresensi yang direkam pada piksel itu).

Masalahnya adalah untuk menggabungkan semua pengukuran piksel xwfcp untuk menghasilkan "ukuran yang wajar" Xt dari efek t perlakuan tpada sel yang diperlakukan dengannya, serta beberapa ukuran "penyebaran" Xt .

Pendekatan standar untuk masalah tersebut adalah dengan menggunakan mean sebagai "ukuran" dan varians (atau standar deviasi) sebagai "penyebaran". Namun, dalam kasus ini, ada banyak cara yang tidak setara yang berarti dan varians dapat dihitung.

Fokus untuk saat ini pada sarana, pada satu titik, seseorang dapat menambahkan xwfcp di semua piksel (mengabaikan distribusinya atas sel, bidang, dan sumur), dan membagi jumlah ini dengan jumlah total piksel P ( untuk perawatan t ):

1Pw=1Wf=1Fwc=1Cwfp=1Pwfcxwfcp

Pada ekstrem yang berlawanan, kita dapat rata-rata di setiap tingkat: pertama menghitung rata-rata xwfc dari xwfcp untuk setiap sel, kemudian menghitung rata-rata xwf dari xwfc untuk setiap bidang, dan seterusnya:

1Ww=1W[1Fwf=1Fw[1Cwfc=1Cwf[1Pwfcp=1Pwfcxwfcp]]]

Secara umum, kedua ungkapan ini tidak akan sama. Plus ada beberapa variasi di antaranya. Menurut perhitungan saya, ada 8 cara untuk melakukan ini (termasuk dua di atas); Saya telah membuat daftar semua dalam kemuliaan penuh mereka di akhir posting ini. Sebagai contoh, seseorang dapat menghitung ini (nomor 6 dalam daftar di bawah):

1Ww=1W[1Cwf=1Fwc=1Cwf[1Pwfcp=1Pwfcxwfcp]]

... di mana adalah jumlah total sel (dijumlahkan di semua bidang) dengan baik . (Resep yang disandikan dengan ungkapan ini berbunyi: "hitung nilai rata-rata untuk setiap sel, yaitu ; lalu, untuk setiap sumur , hitung rata-rata rata-rata atas semua sel di dalam sumur mengabaikan distribusi mereka di atas bidang—, yaitu ; dan, akhirnya, rata-rata atas semua sumur , ")Cw=fc1wxwfcpxwfc=[pxwfcp]/PwfcpwxwfcCwwxw=[fcxwfc]/CwxwW[wxw]/W

Dihadapkan dengan semua cara yang berbeda ini untuk "menggunakan rata-rata" untuk mengukur efek dari pengobatan t , pertanyaan langsung, tentu saja, yang satu untuk memilih? Versi pertanyaan yang lebih tajam adalah: bagaimana saya bisa menentukan di bawah skenario mana varian tertentu akan sesuai / informatif / berguna?

Dan, secara lebih umum: apakah ada kesulitan dalam menghitung rata-rata rata-rata (rata-rata ...)?

Terima kasih!


(koreksi diterima)
1.1Pw=1Wf=1Fwc=1Cwfp=1Pwfcxwfcp2.1Ww=1W[1Pwf=1Fwc=1Cwfp=1Pwfcxwfcp]wherePw=f=1Fwc=1Cwfp=1Pwfc13.1Fw=1Wf=1Fw[1Pwfc=1Cwfp=1Pwfcxwfcp]whereF=w=1Wf=1Fw1,Pwf=c=1Cwfp=1Pwfc14.1Cw=1Wf=1Fwc=1Cwf[1Pwfcp=1Pwfcxwfcp]whereC=w=1Wf=1Fwc=1Cwf15.1Ww=1W[1Fwf=1Fw[1Pwfc=1Cwfp=1Pwfcxwfcp]]6.1Ww=1W[1Cwf=1Fwc=1Cwf[1Pwfcp=1Pwfcxwfcp]]whereCw=f=1Fwc=1Cwf17.1Fw=1Wf=1Fw[1Cwfc=1Cwf[1Pwfcp=1Pwfcxwfcp]]8.1Ww=1W[1Fwf=1Fw[1Cwfc=1Cwf[1Pwfcp=1Pwfcxwfcp]]]

kjo
sumber
1
Anda dapat melakukan anova bersarang untuk mengidentifikasi apakah ada efek pengobatan yang signifikan. Referensi yang baik adalah Biometri oleh Sokal dan Rholf.
aaronjg
Semua persamaan di bagian bawah pertanyaan adalah sama, karena rata-rata aritmatika adalah fungsi linier. Fraksi adalah skalar, sehingga dapat dipindahkan ke luar jumlah dalam setiap kasus. Urutan jumlah tidak penting. Semuanya setara dengan .
1WFCPw,f,c,pW,F,C,Pxwfcp
naught101
@ naught101: Saya benar-benar tidak setuju. Untuk mulai dengan, ungkapan dalam komentar Anda bahkan tidak konsisten dengan notasi yang saya gunakan dalam pertanyaan saya.
kjo
Sudahkah Anda mencoba menghitungnya? Perhatikan bahwa ada satu hal yang saya lewatkan: Anda menyebutkan varians, dan dalam hal itu (berarti varians vs varians berarti) tentu berbeda, karena varians bukan operator linier (ia memiliki jumlah kotak di dalamnya).
nucky101

Jawaban:

5

Ini bukan jawaban langsung untuk pertanyaan Anda ('Jenis rata-rata mana yang harus dipilih'), tetapi lebih merupakan rekomendasi untuk menghindari penghitungan rata-rata sama sekali:

Skenario Anda tampaknya terlihat seperti kasus hierarchical / multilevel model (MLM), karena data bersarang dengan sempurna. Anda memiliki tiga tingkat efek acak: piksel (Level 1) bersarang dalam sel (L2), bersarang di bidang (L3), bersarang di sumur (L4). Perawatan harus diperlakukan sebagai efek tetap.

Anda hanya tertarik pada efek perawatan; metode MLM menangani variasi yang berbeda dari setiap tingkat dan memberi Anda juga perkiraan berapa banyak perbedaan dijelaskan oleh tingkat mana. Jadi Anda tidak 'kehilangan' varians apa pun dengan memperlakukan nilai rata-rata sebagai 'pengukuran', tetapi Anda memperkirakan model pada tingkat data mentah.

Metode ini, bagaimanapun, membutuhkan jumlah grup yang cukup untuk setiap efek acak (yaitu, cukup piksel, cukup sel, cukup bidang, cukup sumur). Karena Anda tidak tertarik pada interaksi lintas level, rekomendasi umum mengatakan sesuatu seperti minimum 10 hingga 30 unit (tentu saja, tergantung pada skenario spesifik, dll.; Lihat, misalnya, di sini ).

Felix S
sumber
Tautan pertama yang Anda berikan (model hierarkis / multilevel) tampaknya rusak sekarang.
steko