Apakah tumpang tindih antara dua sampel ekspresi gen signifikan?

8

Saya telah melakukan percobaan untuk mempelajari respons ragi (yang mengandung 5.000 gen) terhadap stres akibat sengatan panas. Saya memiliki satu daftar 48 gen yang diekspresikan berlebih pada 37ºC dan daftar lain dari 145 gen yang diekspresikan berlebih pada 42ºC. Ada 38 gen yang diekspresikan berlebih di keduanya.

Secara kebetulan saya berharap hanya 1 gen yang diekspresikan berlebih di keduanya, bagaimana saya bisa menghitung jika tumpang tindih yang saya dapatkan secara signifikan? Bagaimana saya bisa mendapatkan nilai ? Saya tidak tahu apa-apa tentang perangkat lunak biostatistik atau matematika. Terima kasih banyak!!! Setiap bantuan akan sangat disambut :)p

Laura
sumber
Anda bisa membuat diagram Venn untuk menunjukkan tumpang tindih.
Michael R. Chernick
Tapi Bagaimana saya bisa menghitung nilai p?
Laura
Nilai-p selalu dihitung dalam kaitannya dengan hipotesis. Apa hipotesis yang ingin Anda selidiki di sini? Bahwa gen yang berbeda diekspresikan berlebih pada suhu yang berbeda?
MånsT
Hipotesisnya adalah bahwa gen yang diekspresikan berlebih pada suhu 37ºC juga diekspresikan berlebih pada suhu 42ªC. Dan sepertinya itu bisa terjadi karena 38 gen (dari total 48 gen) diekspresi berlebih pada suhu 37ºC dan 42ºC.
Laura
Itu bukan hipotesis statistik yang dapat diuji. Saya tidak berpikir Anda mencari nilai-p. Saya pikir Anda ingin mengukur tingkat tumpang tindih.
Michael R. Chernick

Jawaban:

4

Tabelnya terlihat seperti ini

                37 deg C
42 deg C     yes      no
yes          38       97
no           10      4855

ya dan tidak merujuk pada kasus-kasus yang diekspresikan berlebih atau tidak, saya menjalankan tes Fisher di SAS. Outputnya ditempelkan di bawah ini:

Laura Gene expression data 


The FREQ Procedure


Statistics for Table of Group by expressed

Fisher's Exact Test 
Cell (1,1) Frequency (F) 4855 
Left-sided Pr <= F 1.0000 
Right-sided Pr >= F 4.776E-53 

Table Probability (P) 8.132E-51 
Two-sided Pr <= P 4.776E-53 
Sample Size = 5000

Anda lihat di sini bahwa nilai p untuk uji Fisher's Exact sangat kecil, jauh lebih kecil dari 0,0001.

Ini menunjukkan dengan tepat apa yang Anda nyatakan yang diamati yang diekspresikan berlebih pada kedua suhu jauh lebih besar daripada yang Anda harapkan di bawah kemandirian yang seperti yang Anda nyatakan 1.296.

Michael R. Chernick
sumber
3

Tes yang tepat disebut oleh Michael mungkin cara saya akan merekomendasikan menggunakan untuk menyelesaikan masalah (asumsi paling sedikit). Untuk referensi, uji statistik umum yang sesuai akan menjadi tes kemerdekaan .χ2

russellpierce
sumber
1
Tes chi kuadrat juga nonparametrik tetapi membutuhkan teori asimptotik. Uji Fisher memiliki asumsi tambahan tentang margin tetap yang tidak diasumsikan oleh chi square dan tabel kontingensi lainnya.
Michael R. Chernick
@ Laura Anda memang memiliki masalah pengujian yang terdefinisi dengan baik. Saya menyesal karena butuh banyak diskusi bolak-balik untuk menemukannya.
Michael R. Chernick
Terima kasih banyak Michael! Sekarang saya tahu tes yang harus saya gunakan dan cara memasukkan data. Hanya dua pertanyaan kecil lagi: Apakah ada kalkulator tes Fischer online yang tepat? Karena saya belum SAS dan saya ingin menghitung lebih banyak nilai p. Dan di meja Anda berapa nilai p yang harus saya pertimbangkan? Mungkin probabilitas dua sisi? Terima kasih lagi!!! :)
Laura
1
Laura ... pergi dengan Pr dua sisi. quantitativeskills.com/sisa/statistics/fishrhlp.htm (tautan "buka prosedur"). Kalkulator online tidak memiliki kesetiaan untuk memberi Anda nilai p yang rendah.
russellpierce