Saya punya satu set data, dan x . Saya ingin menguji hipotesis berikut: Ada puncak dalam y ; yaitu ketika x meningkat, y pertama-tama meningkat dan kemudian menurun.
Ide pertama saya adalah pas dan x 2 di SLR. Yaitu, jika saya menemukan bahwa koefisien sebelum x adalah positif signifikan dan koefisien sebelum x 2 adalah negatif signifikan, maka saya memiliki dukungan untuk hipotesis. Namun, ini hanya memeriksa satu jenis hubungan (kuadratik) dan mungkin belum tentu menangkap keberadaan puncak.
Kemudian saya berpikir untuk menemukan , daerah seperti (diurutkan nilai-nilai) x , yang b adalah antara satu dan c , dua daerah lain x yang mengandung setidaknya poin sebanyak b , dan bahwa ¯ y b > ¯ y a dan ¯ y b > ¯ y c secara signifikan. Jika hipotesis itu benar, kita harus berharap banyak daerah seperti itu b . Jadi, jika jumlah b cukup besar, harus ada dukungan untuk hipotesis.
Apakah Anda pikir saya berada di jalur yang benar untuk menemukan tes yang sesuai untuk hipotesis saya? Atau apakah saya yang menciptakan roda dan ada metode yang sudah mapan untuk masalah ini? Saya akan sangat menghargai masukan Anda.
MEMPERBARUI. Saya tergantung variabel adalah count (integer non-negatif).
sumber
Jawaban:
Saya sedang memikirkan ide smoothing juga. Tetapi ada seluruh area yang disebut metodologi permukaan respon yang mencari puncak dalam data berisik (terutama melibatkan penggunaan kuadratik lokal untuk data) dan ada kertas terkenal yang saya ingat dengan "Bump hunting" pada judulnya. Berikut adalah beberapa tautan ke buku tentang metodologi permukaan respons. Buku-buku Ray Myer ditulis dengan sangat baik. Saya akan mencoba mencari kertas perburuan benjolan.
Metodologi Permukaan Tanggapan: Proses dan Optimalisasi Produk Menggunakan Eksperimen yang Dirancang
Metodologi Permukaan Respon Dan Topik Terkait
Metodologi permukaan respons
Bangunan Model Empiris dan Permukaan Respons
Meskipun bukan artikel yang saya cari, berikut adalah artikel yang sangat relevan oleh Jerry Friedman dan Nick Fisher yang membahas ide-ide ini yang diterapkan pada data dimensi tinggi.
Berikut ini adalah artikel dengan beberapa komentar online.
Jadi saya harap Anda setidaknya menghargai tanggapan saya. Saya pikir ide-ide Anda bagus dan di jalur yang benar, tetapi ya saya pikir Anda mungkin menemukan kembali roda dan saya harap Anda dan orang lain akan melihat referensi yang sangat baik ini.
sumber
Meskipun Anda belum menjawab pertanyaan saya, jika dugaan saya benar, Anda mencari tes white noise yang ada dalam domain frekuensi untuk menunjukkan bahwa spektrumnya datar. Jadi uji periodogram Fisher yang dalam referensi ini disebut Fisher's kappa dapat digunakan. Lihat tautannya.
http://www4.stat.ncsu.edu/~dickey/Spain/pdf_Notes/Spectral2.pdf
Tes Bartlett juga disebutkan dalam referensi. Sekarang menolak jumlah hipotesis nol untuk menemukan puncak yang signifikan dalam periodogram. Ini berarti bahwa komponen periodik ada dalam deret waktu.
Karena tes ini dalam domain frekuensi dan melibatkan ordinat periodogram, ordinat memiliki distribusi chi square 2 di bawah hipotesis nol dan independen. Distribusi khusus ini terjadi hanya karena transformasi ke domain frekuensi. Jika x adalah waktu, ini tidak akan bekerja dalam domain waktu atau secara umum distribusi untuk ys tidak akan menjadi chi square independen.
sumber