Pengujian hipotesis dan signifikansi untuk deret waktu

19

Tes signifikansi yang biasa dilakukan ketika mencari dua populasi adalah uji-t, uji-t berpasangan jika memungkinkan. Ini mengasumsikan bahwa distribusinya normal.

Adakah asumsi penyederhanaan serupa yang menghasilkan uji signifikansi untuk rangkaian waktu? Secara khusus kami memiliki dua populasi tikus yang cukup kecil yang diperlakukan berbeda, dan kami mengukur berat badan seminggu sekali. Kedua grafik menampilkan fungsi yang semakin lancar, dengan satu grafik jelas di atas yang lainnya. Bagaimana kita mengukur "kepastian" dalam konteks ini?

Hipotesis nol haruslah bahwa bobot kedua populasi "berperilaku dengan cara yang sama" seiring berjalannya waktu. Bagaimana seseorang dapat merumuskan ini dalam hal model sederhana yang cukup umum (seperti halnya distribusi normal adalah umum) dengan hanya sejumlah kecil parameter? Setelah seseorang melakukan itu, bagaimana seseorang dapat mengukur signifikansi atau sesuatu yang analog dengan nilai-p? Bagaimana dengan memasangkan tikus, mencocokkan karakteristik sebanyak mungkin, dengan masing-masing pasangan memiliki satu perwakilan dari masing-masing dua populasi?

Saya akan menyambut pointer ke beberapa buku atau artikel relevan yang ditulis dengan baik dan mudah dipahami tentang seri waktu. Saya mulai sebagai orang bebal. Terima kasih atas bantuan Anda.

David Epstein

David Epstein
sumber
Anda mungkin ingin menggunakan jaringan yang lebih luas, karena ini belum tentu merupakan pertanyaan deret waktu. Memang, mungkin pertanyaan paling mendasar di sini menyangkut cara terbaik atau setidaknya benar untuk mengukur "titik akhir" pengobatan: apakah itu berarti pertumbuhan dalam suatu populasi setelah waktu tertentu, tingkat pertumbuhan rata-rata dari waktu ke waktu, dll? Jika Anda tidak mengetahui hal ini sebelum memulai percobaan dan tiba-tiba memperhatikan perbedaan yang konsisten dalam kurva pertumbuhan, maka Anda sedang mengerjakan mode eksplorasi , bukan yang konfirmasi, dan nilai-p pengujian hipotesis akan tampak baik.
whuber
Hasilnya secara kualitatif seperti yang diharapkan, dan tes satu sisi tampaknya tepat. Alasan saya bertanya tentang deret waktu, adalah bahwa jika seseorang hanya mengukur bobot akhir (yang merupakan pengukuran paling relevan), maka seseorang membuang semua informasi dari titik waktu sebelumnya, dan itu tampaknya salah.
David Epstein
Anda benar: Anda tidak ingin membuang data itu. Tetapi teknik deret waktu muncul ke depan untuk model-model data di mana korelasi temporal penyimpangan dari kurva ideal adalah penting, baik untuk kepentingan mereka sendiri atau karena mereka dapat mengganggu estimasi yang baik. Situasi Anda tidak akan termasuk dalam salah satu dari kasus-kasus ini. Metode yang lebih sederhana dan bermakna secara ilmiah tersedia.
whuber
@whuber, bukankah bobot dari waktu ke waktu set kontrol tikus merupakan "kurva ideal" dalam arti tertentu? Atau setidaknya, model teoretis cocok dengan data itu?
naught101
1
Ya, tentu saja, itu cara yang masuk akal untuk melihatnya. Tetapi "kurva" tidak sama dengan "deret waktu." Misalnya, regresi linier dapat (dan seringkali) dipandang sebagai kurva yang pas untuk data, tetapi terpisah dari analisis deret waktu, yang menekankan struktur korelasi antara penyimpangan antara data dan kurva ideal.
Whuber

Jawaban:

1

Ada banyak cara untuk melakukannya jika Anda menganggap variasi berat sebagai proses yang dinamis.

Misalnya, dapat dimodelkan sebagai integrator x˙(t)=θx(t)+v(t)

x(t)θv(t)v(t)N(0,Q)Q

θθθ1θ2

Untuk referensi, saya bisa menyarankan buku ini .

andrecb
sumber
0

Saya menyarankan mengidentifikasi model ARIMA untuk masing-masing tikus secara terpisah dan kemudian memeriksanya untuk persamaan dan generalisasi. Sebagai contoh jika tikus pertama memiliki AR (1) dan yang kedua memiliki AR (2), model yang paling umum (terbesar) adalah AR (2). Perkirakan model ini secara global yaitu untuk deret waktu gabungan. Bandingkan jumlah kesalahan kuadrat untuk himpunan gabungan dengan jumlah dari dua jumlah kesalahan individu kuadrat untuk menghasilkan nilai F untuk menguji hipotesis parameter konstan di seluruh kelompok. Saya berharap Anda dapat memposting data Anda dan saya akan menggambarkan tes ini dengan tepat.

KOMENTAR TAMBAHAN:

Karena kumpulan data normal-otomatis berkorelasi tidak berlaku. Jika pengamatan independen dari waktu ke waktu maka orang mungkin menerapkan beberapa metode seri non-waktu yang terkenal. Sehubungan dengan permintaan Anda tentang buku yang mudah dibaca tentang deret waktu, saya sarankan teks Wei oleh Addison-Wesley. Ilmuwan sosial akan menemukan pendekatan non-matematis Mcleary dan Hay (1980) lebih intuitif tetapi kurang keras.

IrishStat
sumber
1
Ini benar-benar tampaknya tidak mengatasi masalah mendasar. (1) Mengapa model seperti itu tepat? (2) Mengapa setiap tikus harus dimodelkan dan tidak, katakanlah, populasi rata-rata memiliki bobot atau kenaikan dalam bobot? (3) Mengapa uji parameter konstan relevan? Pertanyaan itu meminta tes satu sisi. Sebagian besar parameter yang Anda sebutkan tidak tampak relevan secara ilmiah, dan juga tidak langsung mengukur rasa satu grafik yang konsisten di atas yang lain. (4) Bagaimana Anda mengendalikan kemungkinan perbedaan karakteristik dari kedua populasi pada awal percobaan?
whuber
: whuber Uji konstanta parameter relevan karena Anda memiliki aset koefisien untuk grup pertama dari formings 1 & satu set koefisien kedua untuk mouse ke-2. Pertanyaannya adalah "adakah perbedaan kolektif yang signifikan antara koefisien". Sekarang lanjutkan dengan komentar Anda, karena salah satu model koefisien mungkin konstan dan jika itu maka perbedaan antara koefisien mungkin karena konstanta berbeda secara statistik satu sama lain. Perhatikan bahwa model ARIMA yang mendasari mungkin tidak selalu memiliki konstanta sebagai mungkin model perbedaan.
IrishStat
1
Saya pikir Anda sebagian benar, tetapi Anda perlu memperbaiki karakterisasi Anda dari masalah. Banyak dari koefisien ARIMA mungkin secara ilmiah tidak relevan. Misalnya, jika salah satu dari mereka bertindak seperti istilah kuadrat dari waktu ke waktu, perbedaan mungkin mengatakan sesuatu tentang bentuk kurva pertumbuhan tetapi itu bisa sedikit berguna. Jika seseorang memilih koefisien untuk mencerminkan titik akhir eksperimental dan menguji hanya mereka, beberapa hal yang baik dapat dicapai dengan demikian. Secara umum, meskipun, model deret waktu memperkenalkan koefisien (misalnya, autokorelasi) tidak mungkin menjadi kepentingan ilmiah langsung di sini.
whuber
whuber: "Jika seseorang memilih koefisien untuk mencerminkan titik akhir eksperimental (s) dan hanya menguji mereka, beberapa hal baik dapat dicapai dengan demikian" tidak masuk akal bagi saya karena mengabaikan poin perantara. Bertentangan dengan komentar Anda, mode deret waktu dan koefisien yang menyertainya adalah kepentingan ilmiah yang signifikan karena mencirikan distribusi bacaan dan mengubahnya menjadi proses acak (istilah kesalahan) yang bebas dari struktur autokorelasi dan kemudian dapat diuji. membutuhkan normalitas. Tes yang saya usulkan mengharuskan anggapan itu berlaku.
IrishStat
1
Autokorelasi mungkin tidak begitu penting di sini. Bunga secara eksplisit berfokus pada tren: bagaimana kurva pertumbuhan yang mendasari cenderung berbeda antara kedua populasi? Parameter autokorelasi adalah parameter gangguan, yang akan diperkenalkan dan ditangani hanya sejauh mereka dapat membantu meningkatkan estimasi kurva pertumbuhan tersebut. Prioritas pertama adalah untuk mengadopsi model pertumbuhan ilmiah, mewakili model itu dengan parameter yang dapat diinterpretasikan dan menarik, dan memperkirakannya . Aplikasi otomatis dari teknik deret waktu tidak mungkin mencapai itu.
whuber