Saya memerlukan beberapa panduan tentang tingkat pengumpulan yang tepat untuk digunakan untuk perbedaan tes sarana pada data deret waktu. Saya prihatin dengan replikasi palsu semu dan pengorbanan, yang tampaknya menjadi tekanan pada aplikasi ini. Ini mengacu pada studi mensural daripada eksperimen manipulatif.
Pertimbangkan latihan pemantauan : Sistem sensor mengukur kandungan oksigen terlarut (DO) di banyak lokasi di seluruh lebar dan kedalaman kolam. Pengukuran untuk masing-masing sensor direkam dua kali sehari, karena DO diketahui bervariasi diurnalnya. Kedua nilai tersebut dirata-rata untuk mencatat nilai harian. Sekali seminggu, hasil harian dikumpulkan secara spasial untuk sampai pada konsentrasi DO mingguan tunggal untuk seluruh kolam.
Hasil mingguan tersebut dilaporkan secara berkala, dan selanjutnya dikumpulkan - hasil mingguan dirata-rata untuk memberikan konsentrasi DO bulanan untuk kolam. Hasil bulanan dirata-rata untuk memberikan nilai tahunan. Rata-rata tahunan sendiri dirata-rata untuk melaporkan konsentrasi DO decadal untuk kolam.
Tujuannya adalah untuk menjawab pertanyaan seperti: Apakah konsentrasi DO kolam pada tahun X lebih tinggi, lebih rendah, atau sama dengan konsentrasi pada tahun Y? Apakah konsentrasi DO rata-rata dalam sepuluh tahun terakhir berbeda dari pada dekade sebelumnya? Konsentrasi DO di kolam menanggapi banyak input dengan magnitudo besar, dan karenanya sangat bervariasi. Tes signifikansi diperlukan. Metode ini menggunakan perbandingan uji-T rata-rata. Mengingat bahwa nilai-nilai decadal adalah rata-rata dari nilai-nilai tahunan, dan nilai-nilai tahunan adalah rata-rata dari nilai-nilai bulanan, ini tampaknya tepat.
Inilah pertanyaannya - Anda dapat menghitung rata-rata decadal dan nilai-T dari rata-rata tersebut dari nilai DO bulanan, atau dari nilai DO tahunan. Mean tidak berubah tentu saja, tetapi lebar interval kepercayaan dan nilai-T tidak. Karena urutan besarnya lebih tinggi N dicapai dengan menggunakan nilai-nilai bulanan, CI sering memperketat jika Anda pergi rute itu. Ini dapat memberikan kesimpulan yang berlawanan vs menggunakan nilai-nilai tahunan sehubungan dengan signifikansi statistik dari perbedaan yang diamati dalam rata-rata, menggunakan tes yang sama pada data yang sama. Apa interpretasi yang tepat dari perbedaan ini?
Jika Anda menggunakan hasil bulanan untuk menghitung statistik uji untuk perbedaan dalam rata-rata dekadal, apakah Anda bertabrakan dengan pseudoreplikasi temporal? Jika Anda menggunakan hasil tahunan untuk menghitung tes decadal, apakah Anda mengorbankan informasi dan dengan demikian membuat kesalahan?
Jawaban:
Saya percaya bahwa Anda mencoba menggunakan metode statistik yang sesuai untuk pengamatan independen sementara Anda memiliki data yang berkorelasi, baik sementara dan spasial. Jika Anda memiliki pengamatan mengatakan selama 5 jam dan memutuskan untuk menyatakan kembali ini sebagai 241 pengamatan diambil setiap menit, Anda benar-benar tidak memiliki 240 derajat kebebasan sehubungan dengan rata-rata dari 241 nilai ini. Autokorelasi berpotensi menghasilkan pernyataan yang terlalu berlebihan dari ukuran "N" dan dengan demikian menciptakan pernyataan ketidakpastian palsu. Yang perlu Anda lakukan adalah menemukan seseorang / beberapa buku teks / beberapa situs web / .... untuk mengajari Anda tentang data deret waktu dan analisisnya. Salah satu cara untuk memulai adalah dengan GOOGLE "bantu saya memahami rangkaian waktu" dan mulai membaca / belajar. Ada banyak bahan yang tersedia di web.http://www.autobox.com/AFSUniversity/afsuFrameset.htm . Saya menyebutkan ini karena saya masih terkait dengan perusahaan ini dan produk-produknya sehingga komentar saya "bias dan berpendapat" tetapi tidak hanya mementingkan diri sendiri.
sumber