Dapatkah seseorang membantu saya memahami jenis masalah apa yang saya lihat? Tidak yakin apakah ini diklasifikasikan sebagai pengujian hipotesis

Maafkan saya jika pertanyaan ini tidak jelas. Saya tidak yakin apakah saya menggunakan terminologi yang tepat.

Saya telah melakukan percobaan di lingkungan yang berbeda beberapa kali. Jadi data saya terlihat seperti ini:

Environment1  1.2  2.1  1.1  1.5  1.6
Environment2  4.2  2.6  3.5  2.5  2.9
Environment3  7.2  4.6  5.3  4.5  1.6
Environment4  0.0  0.0  1.2  15.0 0.0
Environment5  3.2  2.4  7.2  5.5  6.6
Environment6  23.2  32.1  18.1  1.5  19.6

Saya dapat dengan jelas melihat (atau mungkin intuisi saya mengatakan) bahwa percobaan tidak dilakukan dengan benar di Environment4 (terlalu rendah dan banyak berfluktuasi) dan Environment5 (terlalu tinggi) tetapi saya tidak yakin bagaimana membuktikannya. Apakah saya seharusnya mengandalkan pengujian hipotesis dengan hipotesis:

Percobaan tidak dilakukan dengan benar di Lingkungan 4 dan 6.

dan kemudian gunakan beberapa prosedur untuk membuktikan ini? Atau adakah cara standar untuk menunjukkan ini? Dapatkah seseorang tolong bantu saya cara mendekati masalah seperti ini? Saya menggunakan R.

r distributions hypothesis-testing statistical-significance experiment-design Legenda
sumber

Pertanyaan yang bagus, ini adalah contoh yang baik untuk mengekspos prosedur yang berbeda, karena pada dasarnya kita tahu tanpa matematika atau formalitas, bahwa Lingkungan 4 dan 6 berbeda dengan yang lainnya (dan Lingkungan 1 sedikit berbeda dari 2, 3, dan 5). Dengan demikian setiap prosedur yang baik harus dapat menghasilkan hasil yang jelas, hanya perbedaan yang datang dari mengukur seberapa berbeda dalam arti matematika. Pertanyaan yang jelas adalah "adakah cara lain agar eksperimen benar-benar menghasilkan hasil ini, selain kesalahan?"

probabilityislogic

@probabilityislogic: Terima Kasih. Apa yang Anda katakan bermanfaat: jika saya dapat mengukur efektivitas percobaan di setiap lingkungan, entah bagaimana saya bisa mengatakan sesuatu tetapi saya masih tidak yakin harus berkata apa atau bagaimana mengatakannya. Ah .. (... merasa bodoh mengetik teka-teki) :) Mengenai pertanyaan Anda: percobaan cukup terkontrol dalam arti bahwa, itu memastikan bahwa lingkungan tidak berubah. Namun, prosedurnya bisa saja salah. Mungkin prosedur itu tidak dijalankan dengan benar sesuai dengan pedoman (mungkin?)

Legenda

Saya berbicara lebih banyak di sepanjang baris "adalah jumlah yang bermakna secara fisik? Apa yang akan terjadi di dunia nyata jika ini benar." Mungkin bermanfaat juga untuk berbicara dengan seseorang yang benar-benar melakukan percobaan 4 atau 6 (lebih disukai orang yang mencatat data).

32.1

$32.1$

probabilityislogic

@probabilityislogic: Begitu. Saya mengerti maksud Anda. Data pertanyaan adalah variabel waktu respons. Menurut saya pertanyaan Anda adalah apakah nilainya masuk akal di dunia fisik tetapi terlalu tidak biasa untuk disebut kasus langka. Orang yang saya ajak bicara mengatakan dia tidak melakukan sesuatu yang berbeda. Sebenarnya, data yang saya letakkan di sini hanya sampel dari seluruh data dan ada beberapa kasus seperti ini menyebar di sana-sini.

Legenda

sehingga akan tampak bahwa hasil yang paling mungkin adalah kesalahan, tetapi penemuan menarik dapat dibuat jika Anda "menggali lebih dalam" untuk berbicara. Mungkin semacam penemuan baru! tetapi jangan terlalu bersemangat, mungkin itu bukan apa-apa, tetapi mungkin ada gunanya untuk menghibur kemungkinan itu, dan melihat ke mana ia menuntun Anda.

probabilityislogic

Anda dapat melakukan tes siswa untuk melihat apakah rata-rata berbeda antara kelompok 4,6 dan yang lainnya. Bahkan jika ukuran sampel Anda kecil, Anda akan menyimpulkan perbedaan. Perhatikan bahwa ini akan memberi tahu Anda bahwa grup 4,6 secara signifikan berbeda rata-rata dari yang lain, tetapi tidak akan memberi tahu Anda bahwa "Eksperimen tidak dilakukan dengan benar di Lingkungan 4 dan 6" yang tidak dapat dijawab tanpa sepengetahuan apa "benar" artinya dalam pengamatan.

robin girard
sumber

girad: Sebenarnya, pertanyaan ini muncul dari seseorang di atas tim penguji. Dengan benar berarti bahwa mereka diberi serangkaian instruksi untuk dieksekusi untuk mendapatkan nilai akhir. Eksperimen akan selesai bahkan jika salah satu instruksi dilewati tetapi akan menghasilkan pengamatan yang salah. Saya akan memeriksa student testyang Anda sebutkan. Tetapi jika tes ini mengandalkan rata-rata, bukankah seharusnya berarti ukuran yang buruk karena sensitivitasnya terhadap perubahan nilai data? Terima kasih atas waktu Anda.

Legenda

@Legend Tes perbedaan cara mungkin tidak tepat, tetapi itu bukan kesalahan @robin, seperti yang ditunjukkan pada bagian kedua dari tanggapannya, yang tepat: tes yang digunakan ditentukan oleh karakteristik dari serangkaian suite hasil menandakan percobaan "tidak patut". Anda dapat melakukan uji-F untuk perbedaan standar deviasi; Anda bisa melakukan beberapa tes outlier; Anda bisa melakukan tes Kruskal-Wallis; dll, tergantung pada perbedaan apa yang Anda cari.

whuber

@ Legenda Ada juga kesulitan lain yang dibayangi oleh pertanyaan Anda karena di sini Anda menebak bahwa 4,6 adalah sampel yang berbeda. Tetapi bagaimana jika Anda tidak tahu sebelumnya ... Anda harus menguji semua konfigurasi dan mungkin memperkenalkan beberapa kriteria hipotesis. Dalam hal ini sepertinya deteksi outlier dan banyak pertanyaan sudah ditangani di sini.

robin girard

@whuber: Saya tidak bermaksud melihatnya adalah kesalahan siapa pun. Saya seorang pemula di sini jadi saya minta maaf jika terdengar begitu. @robin girard: Itu pendapat yang sangat menarik. Terima kasih. Saya hanya berpikir tentang deteksi outlier. Apakah Anda dapat mengarahkan saya ke beberapa materi yang relevan untuk kasus khusus ini? Semua yang saya gunakan sebelumnya adalah yang sederhana seperti k-means dll.

Legenda

Dapatkah seseorang membantu saya memahami jenis masalah apa yang saya lihat? Tidak yakin apakah ini diklasifikasikan sebagai pengujian hipotesis

Jawaban: