Pesan ini dalam artikel Reuter dari 25.02.2019 saat ini ada di seluruh berita:
Bukti untuk pemanasan global buatan manusia mencapai 'standar emas'
[Ilmuwan] mengatakan keyakinan bahwa aktivitas manusia yang meningkatkan panas di permukaan bumi telah mencapai level "lima-sigma", ukuran statistik yang berarti hanya ada peluang satu-dalam-sejuta bahwa sinyal akan muncul jika ada tidak ada pemanasan.
Saya percaya bahwa ini merujuk pada artikel ini "Merayakan ulang tahun tiga peristiwa utama dalam ilmu perubahan iklim" yang berisi plot, yang ditunjukkan secara skematis di bawah ini (Ini adalah sketsa karena saya tidak dapat menemukan gambar open source untuk yang asli, serupa gambar gratis dapat ditemukan di sini ). Artikel lain dari kelompok penelitian yang sama, yang tampaknya merupakan sumber yang lebih asli, ada di sini (tetapi menggunakan signifikansi 1%, bukannya ).
Plot ini menyajikan pengukuran dari tiga kelompok penelitian yang berbeda: Sistem Penginderaan Jauh, Pusat Aplikasi dan Penelitian Satelit, dan Universitas Alabama di Huntsville.
Plot menampilkan tiga kurva peningkatan rasio sinyal ke kebisingan sebagai fungsi dari panjang tren.
Jadi, entah bagaimana para ilmuwan telah mengukur sinyal antropogenik pemanasan global (atau perubahan iklim?) Pada tingkat , yang tampaknya merupakan bukti ilmiah standar .
Bagi saya grafik seperti itu, yang memiliki abstraksi tingkat tinggi, menimbulkan banyak pertanyaan , dan secara umum saya bertanya-tanya tentang pertanyaan 'Bagaimana mereka melakukan ini?' . Bagaimana kita menjelaskan eksperimen ini menjadi kata-kata sederhana (tapi tidak terlalu abstrak) dan juga menjelaskan arti level ? 5σ
Saya mengajukan pertanyaan ini di sini karena saya tidak ingin diskusi tentang iklim. Sebaliknya saya ingin jawaban mengenai konten statistik dan terutama untuk mengklarifikasi makna pernyataan seperti itu yang menggunakan / mengklaim .
Apa hipotesis nolnya? Bagaimana mereka mengatur percobaan untuk mendapatkansinyalantropogenik? Berapaukuranefeksinyal? Apakah ini hanya sinyal kecil dan kami hanya mengukur ini sekarang karena kebisingan berkurang, atau apakah sinyal meningkat? Asumsi macam apa yang dibuat untuk membuat model statistik yang dengannya mereka menentukan persimpangan ambang 5 sigma (independensi, efek acak, dll ...)? Mengapa ketiga kurva untuk kelompok penelitian berbeda, apakah mereka memiliki kebisingan yang berbeda atau mereka memiliki sinyal yang berbeda, dan dalam kasus yang terakhir, apa artinya mengenai interpretasi probabilitas dan validitas eksternal?
sumber
Jawaban:
Ini tidak selalu tentang pengujian statistik. Bisa juga tentang teori informasi.
Istilah 5σ adalah apa yang dikatakannya: rasio "sinyal" ke "noise." Dalam pengujian hipotesis kami memiliki estimasi parameter distribusi, dan standar kesalahan estimasi. Yang pertama adalah "sinyal," yang kedua adalah "noise," dan rasio statistik dan kesalahan standarnya adalah z-statistik, t-statistik, F-statistik, apa saja.
Namun demikian rasio signal-to-noise berguna di mana-mana di mana kita menerima / memahami beberapa informasi melalui beberapa noise. Seperti yang dijelaskan dalam tautan yang dikutip
Dalam kasus kami, "sinyal" adalah perubahan aktual yang diukur dalam suhu beberapa strata atmosfer dan "noise" adalah prediksi perubahan dari simulasi tanpa diketahui pengaruh antropogenik. Kebetulan simulasi ini memperkirakan suhu stasioner lebih atau kurang dengan standar deviasi tertentu σ.
Sekarang kembali ke statistik. Semua statistik uji (z, t, F) adalah rasio estimasi untuk kesalahan standarnya. Jadi ketika kita para ahli statistik mendengar sesuatu seperti S / N, kita memikirkan z-statistik dan melengkapinya dengan probabilitas. Para ahli iklim jelas tidak melakukan ini (tidak ada penyebutan probabilitas di mana pun dalam artikel ). Mereka hanya menemukan bahwa perubahan itu "kira-kira tiga sampai delapan" kali lebih besar seperti yang diharapkan, S / N adalah 3σ ke 8σ.
Apa yang dilaporkan dalam artikel tersebut adalah, bahwa mereka membuat dua jenis simulasi: simulasi dengan pengaruh antropogenik yang diketahui termasuk dalam model dan yang lainnya dengan pengaruh antropogenik yang diketahui dikecualikan. Simulasi pertama mirip dengan data satelit aktual yang diukur, sedangkan yang kedua jauh. Jika ini mungkin atau tidak, mereka tidak mengatakan dan jelas tidak peduli.
Untuk menjawab pertanyaan lain. Mereka tidak membuat percobaan, mereka membuat simulasi sesuai dengan model mereka. Jadi tidak ada hipotesis nol eksplisit kecuali yang jelas, bahwa perubahannya mirip dengan yang diharapkan (S / N adalah 1).
Ukuran efek sinyal adalah perbedaan antara data aktual dan simulasi. Ini adalah sinyal 5 kali lebih besar dari yang diperkirakan (lima kali variabilitas suhu yang biasa). Tampaknya kebisingan berkurang karena jumlah dan keakuratan pengukuran.
Bertolak belakang dengan harapan kami dari "ilmuwan sungguhan," tidak ada model statistik yang dapat kami bicarakan, sehingga pertanyaan tentang asumsi yang dibuat kosong. Satu-satunya asumsi adalah bahwa model mereka memungkinkan mereka untuk memprediksi iklim. Ini sama validnya dengan mengatakan bahwa model yang digunakan untuk prakiraan cuaca solid.
Ada lebih dari tiga kurva. Mereka adalah hasil simulasi dari model yang berbeda. Mereka harus berbeda. Dan ya, ada suara yang berbeda. Sinyal, sejauh berbeda, adalah set pengukuran yang berbeda, yang memiliki kesalahan pengukuran, dan juga harus berbeda. Apa artinya ini mengenai interpretasi? Interpretasi probabilitas S / N tidak bagus. Namun, validitas eksternal dari temuan-temuan itu bagus. Mereka hanya menyatakan bahwa perubahan iklim pada periode 1979 hingga 2011 sebanding dengan simulasi ketika pengaruh antropogenik yang diketahui dicatat dan kira-kira lima kali lebih besar dari yang dihitung dengan simulasi ketika faktor antropogenik yang diketahui dikecualikan dari model.
Jadi ada satu pertanyaan lagi. Jika ahli iklim akan meminta ahli statistik untuk membuat model, apa yang seharusnya? Menurut saya ada sesuatu di garis gerak Brown.
sumber
Peringatan: Saya BUKAN pakar klimatologi, ini bukan bidang saya. Tolong ingat ini. Selamat datang koreksi.
Sosok yang Anda maksud berasal dari makalah terbaru Santer et al. 2019, Merayakan ulang tahun tiga peristiwa utama dalam ilmu perubahan iklim dari Nature Climate Change . Ini bukan makalah penelitian, tetapi komentar singkat. Angka ini adalah pembaruan yang disederhanakan dari tokoh yang sama dari makalah Science sebelumnya dari penulis yang sama, Santer et al. 2018, Pengaruh manusia pada siklus musiman suhu troposfer . Berikut adalah angka 2019:
Dan di sini adalah angka 2018; panel A sesuai dengan angka 2019:
Di sini saya akan mencoba menjelaskan analisis statistik di balik angka terakhir ini (keempat panel). The Ilmu kertas akses terbuka dan cukup mudah dibaca; perincian statistik, seperti biasa, disembunyikan dalam Materi Tambahan. Sebelum membahas statistik seperti itu, kita harus mengatakan beberapa kata tentang data pengamatan dan simulasi (model iklim) yang digunakan di sini.
1. Data
Singkatan RSS, UAH, dan STAR, merujuk pada rekonstruksi suhu troposfer dari pengukuran satelit. Temperatur troposfer telah dipantau sejak 1979 menggunakan satelit cuaca: lihat Wikipedia tentang pengukuran suhu MSU . Sayangnya, satelit tidak mengukur suhu secara langsung; mereka mengukur sesuatu yang lain, dari mana suhu dapat disimpulkan. Selain itu, mereka diketahui menderita berbagai bias tergantung waktu dan masalah kalibrasi. Ini membuat merekonstruksi suhu aktual menjadi masalah yang sulit. Beberapa kelompok penelitian melakukan rekonstruksi ini, mengikuti metodologi yang agak berbeda, dan memperoleh hasil akhir yang agak berbeda. RSS, UAH, dan STAR adalah rekonstruksi ini. Mengutip Wikipedia,
Ada banyak perdebatan tentang rekonstruksi mana yang lebih andal. Setiap kelompok memperbarui algoritme mereka sesekali, mengubah seluruh rangkaian waktu yang direkonstruksi. Inilah sebabnya, misalnya, RSS v3.3 berbeda dari RSS v4.0 pada gambar di atas. Secara keseluruhan, AFAIK diterima dengan baik di lapangan bahwa perkiraan suhu permukaan global lebih tepat daripada pengukuran satelit. Bagaimanapun, yang penting untuk pertanyaan ini, adalah bahwa ada beberapa perkiraan yang tersedia tentang suhu troposfer yang diselesaikan secara spasial, dari tahun 1979 sampai sekarang - yaitu sebagai fungsi dari garis lintang, bujur, dan waktu.
2. Model
Ada berbagai model iklim yang dapat dijalankan untuk mensimulasikan suhu troposfer (juga sebagai fungsi lintang, bujur, dan waktu). Model-model ini mengambil konsentrasi CO2, aktivitas vulkanik, radiasi matahari, konsentrasi aerosol, dan berbagai pengaruh eksternal lainnya sebagai input, dan menghasilkan suhu sebagai output. Model-model ini dapat dijalankan untuk periode waktu yang sama (1979 - sekarang), menggunakan pengaruh eksternal terukur yang sebenarnya. Keluaran kemudian dapat dirata-ratakan, untuk mendapatkan keluaran model rata-rata.
Kita juga dapat menjalankan model ini tanpa memasukkan faktor antropogenik (gas rumah kaca, aerosol, dll.), Untuk mendapatkan gagasan prediksi model non-antropogenik. Perhatikan bahwa semua faktor lain (surya / vulkanik / dll.) Berfluktuasi di sekitar nilai rata-rata, sehingga output model non-antropogenik tidak bergerak oleh konstruksi. Dengan kata lain, model tidak memungkinkan iklim berubah secara alami, tanpa sebab eksternal tertentu.
Apa yang Anda lihat di panel A - D pada gambar di atas adalah iniz nilai untuk tahun akhir analisis yang berbeda.
4. Beberapa komentar
Sidik jari pertama (panel A) adalah, IMHO, yang paling sepele. Ini hanya berarti bahwa suhu yang diamati tumbuh secara monoton sedangkan suhu di bawah hipotesis nol tidak. Saya tidak berpikir orang perlu seluruh mesin yang rumit ini untuk membuat kesimpulan ini. Rangkaian waktu suhu rata-rata global yang lebih rendah (varian RSS) terlihat seperti ini :
dan jelas ada tren yang sangat signifikan di sini. Saya tidak berpikir kita perlu model untuk melihatnya.
sumber