Apakah ada tes statistik untuk membandingkan dua sampel ukuran 1 dan 3?

19

Untuk proyek ekologi, kelompok lab saya menambahkan cuka ke 4 tangki berisi volume air kolam yang sama, 1 kontrol tanpa elodea (tanaman air) dan 3 perawatan dengan jumlah elodea yang sama di masing-masing. Tujuan menambahkan cuka adalah untuk mengurangi pH. Hipotesisnya adalah bahwa tangki dengan elodea akan kembali ke pH normal lebih cepat. Memang benar demikian. Kami mengukur pH setiap tangki setiap hari selama sekitar dua minggu. Semua tangki akhirnya kembali ke pH alami mereka, tetapi lamanya waktu yang dibutuhkan jauh lebih pendek untuk tangki dengan elodea.

Ketika kami memberi tahu profesor kami tentang desain eksperimental kami, ia mengatakan bahwa tidak ada uji statistik yang dapat dilakukan pada data untuk membandingkan kontrol dengan perawatan. Itu karena tidak ada replikasi untuk kontrol (kami hanya menggunakan satu tangki kontrol) kami tidak dapat menghitung varians dan jadi kami tidak dapat membandingkan rata-rata sampel dari kontrol dan perlakuan. Jadi pertanyaan saya adalah, apakah ini benar? Saya benar-benar mengerti apa yang dia maksud. Misalnya, jika Anda mengambil ketinggian satu pria dan satu wanita, Anda tidak bisa menarik kesimpulan tentang populasi masing-masing. Tapi kami melakukan 3 perawatan, dan variansinya kecil. Tampaknya masuk akal untuk berasumsi bahwa varians akan serupa dalam kontrol?

Memperbarui:

Terima kasih atas jawabannya. Kami mendapat lebih banyak air dan elodea dari lahan basah dan memutuskan untuk menjalankan eksperimen lagi dengan tangki yang lebih kecil, tetapi kali ini dengan 5 kontrol dan 5 perawatan. Kami akan menggabungkan ini dengan data asli kami tetapi pH awal tangki cukup berbeda sehingga tampaknya tidak valid untuk mempertimbangkan percobaan baru untuk diambil sampel dari populasi yang sama dengan percobaan asli.

Kami mempertimbangkan untuk menambahkan jumlah elodea yang berbeda dan mencoba untuk mengkorelasikan kecepatan remediasi pH (diukur seiring waktu berlalu hingga pH kembali ke nilai semula) dengan jumlah elodea, tetapi kami memutuskan bahwa itu tidak perlu. Tujuan kami hanya untuk menunjukkan bahwa elodea membuat perbedaan positif, bukan untuk membangun semacam model prediksi untuk bagaimana persisnya pH merespons jumlah elodea yang berbeda. Akan menarik untuk menentukan jumlah optimal dari elodea, tetapi itu mungkin hanya jumlah maksimum yang dapat bertahan. Mencoba menyesuaikan kurva regresi dengan data tidak akan terlalu mencerahkan karena berbagai perubahan rumit yang terjadi pada masyarakat ketika menambahkan jumlah besar. Elodea mati, terurai, organisme baru mulai mendominasi, dan seterusnya.

Simon Hunt
sumber
4
Apakah Anda menambahkan jumlah Elodea yang sama ke masing-masing 3 tangki 'perawatan'?
gung - Reinstate Monica
2
Ya, kami menambahkan jumlah Elodea yang sama untuk setiap perawatan.
Simon Hunt

Jawaban:

21

Perhatikan pertanyaan gung; itu penting. Saya akan berasumsi bahwa perawatannya sama untuk setiap tangki dalam kelompok perlakuan.

Jika Anda dapat menyatakan variansnya akan sama untuk kedua kelompok (yang biasanya Anda anggap sebagai uji-t dua sampel), Anda dapat melakukan tes. Anda tidak bisa memeriksa asumsi itu, tidak peduli seberapa parah pelanggarannya.

Kekhawatiran dinyatakan dalam ini jawaban untuk pertanyaan terkait bahkan lebih relevan dengan situasi Anda, tapi ada sedikit yang dapat Anda lakukan tentang hal itu.

[Anda bertanya apakah masuk akal untuk menganggap variansnya sama. Kami tidak dapat menjawab bahwa untuk Anda, itu adalah sesuatu yang Anda harus meyakinkan para ahli materi pelajaran (yaitu ahli ekologi) adalah asumsi yang masuk akal. Apakah ada penelitian lain di mana kadar tersebut telah diukur di bawah perawatan dan kontrol? Lainnya di mana tes serupa (tes -t atau anova khususnya - saya yakin Anda dapat menemukan preseden yang lebih baik) telah dilakukan atau asumsi serupa dibuat? Suatu bentuk penalaran umum yang dapat Anda lihat untuk diterapkan?

x¯y¯σ2x¯-y¯μx-μyσ2(1/nx+1/ny)n

ny

(x¯-y¯)sx1/nx+1

sxtnx-1

σsxshalny

Edit:

Berikut kurva daya yang disimulasikan untuk tes ini. Ukuran sampel di nol adalah 10.000, di titik lain adalah 1000. Seperti yang Anda lihat, tingkat penolakan di nol adalah 0,05, dan kurva daya, sementara itu membutuhkan perbedaan besar dalam populasi berarti memiliki daya yang layak, memiliki bentuk yang benar. Yaitu, tes ini melakukan apa yang seharusnya.

kurva daya

(Akhiri edit)

Namun, dengan ukuran sampel yang sangat kecil, ini akan agak sensitif terhadap asumsi distribusi.

Jika Anda siap untuk membuat asumsi yang berbeda, atau ingin menguji kesetaraan jumlah populasi lain, beberapa tes masih mungkin dilakukan.

Jadi semuanya tidak hilang ... tetapi jika memungkinkan, umumnya lebih baik untuk memiliki setidaknya beberapa replikasi di kedua kelompok.

Glen_b -Reinstate Monica
sumber
1
Perhatikan bahwa Anda harus mengikuti formula @Glen_b yang diuraikan. Baik Excel dan Minitab tidak akan menghitung ini.
zbicyclist
10
(+1) Pendekatan yang setara (menggunakan rumus yang sama) - dan karenanya lebih banyak amunisi untuk membenarkan jawaban ini - adalah bahwa Anda dapat menghitung interval prediksi untuk satu nilai mendatang dari kelompok perlakuan. Jika nilai kontrol tidak termasuk dalam interval prediksi itu, Anda memiliki bukti signifikan tentang perbedaan antara kedua kelompok. Perbedaannya bisa berupa kombinasi perbedaan dalam rata - rata atau perbedaan dalam varian, tetapi ada (kemungkinan) perbedaan.
whuber
3
σ(x¯-12)sx1/nxt
2
@Glen_b: Tidak yakin apakah ini telah berubah November lalu, tetapi R 3.0 akan melakukan uji-t gabungan ketika salah satu ukuran sampel adalah satu, dan memberikan jawaban yang sama dengan anova.
Aaron - Pasang kembali Monica
2
Bagi siapa pun yang ingin mencobanya di R: t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE) - sepertinya ini berfungsi di R2.15.2 dan R3.0.0 (hanya dua versi yang saya miliki).
Glen_b -Reinstate Monica