Variasi teknis versus sinyal nyata

8

Saya menguji perbedaan dalam hasil yang berkelanjutan di bawah tiga kondisi yang berbeda.

Dalam kondisi AI mengambil pengukuran hasilnya. Saya melakukan ini dua kali untuk sampel yang sama. Nilai contoh bisa 2.2, 2.1. Ini adalah replikasi "teknis" yang berasal dari sumber biologis yang sama

Saya melakukan hal yang sama untuk empat ulangan "biologis" untuk kondisi A:

A1, measure 1: 2.2
A1, measure 2: 2.1
A2, measure 1: 2.0
A2, measure 2: 2.1
A3, measure 1: 1.9
A3, measure 2: 1.8
A4, measure 1: 1.5
A4, measure 2: 1.6

Saya juga memiliki kondisi B, C, dan D, dengan dua ulangan "teknis" di masing-masing dari empat ulangan "biologis".

Bagaimana saya menguji tes untuk perbedaan rata-rata (ANOVA) yang paling cocok untuk variasi teknis dan biologis? Saya tidak ingin mencocokkan model yang menghitung setiap pengukuran sebagai pengamatan terpisah, karena setiap pasangan berasal dari sampel biologis yang sama. Saya berasumsi pasti ada cara yang lebih baik daripada rata-rata pasangan.

Bonus: bagaimana Anda melakukan ini dalam R?

Dengan asumsi saya memiliki data yang terlihat seperti ini:

> data
   condition sample measurement outcome
1          A      1           1     2.2
2          A      1           2     2.1
3          A      2           1     2.0
4          A      2           2     2.1
5          A      3           1     1.9
6          A      3           2     1.8
7          A      4           1     1.5
8          A      4           2     1.6
9          B      1           1     1.7
10         B      1           2     1.6
11         B      2           1     1.5
12         B      2           2     1.6
13         B      3           1     1.4
14         B      3           2     1.3
15         B      4           1     1.0
16         B      4           2     1.1
17         C      1           1     2.4
18         C      1           2     2.3
19         C      2           1     2.2
20         C      2           2     2.3
21         C      3           1     2.1
22         C      3           2     2.0
23         C      4           1     1.7
24         C      4           2     1.8

Saya mungkin tidak ingin melakukan sesuatu seperti ini:

summary(lm(outcome~condition, data=data))

Terima kasih sebelumnya.

Stephen Turner
sumber

Jawaban:

1

Masalahnya adalah Anda memiliki berbagai kemungkinan sumber keacakan. Keacakan individu (istilah kesalahan normal dalam regresi linier); variasi antara dua pengukuran Anda dalam setiap kasus; dan variasi dari unit tertentu yang Anda sampel. Saya pikir Anda mungkin menginginkan sesuatu seperti

model <- aov(outcome ~ condition + Error(samp + measurement), data=mydata)
summary(model)

Semoga itu bisa membantu.

Peter Ellis
sumber