Menghitung kemiringan rata-rata: Rata Harmonik atau Aritmatika?

11

Saya harus menghitung kemiringan persen lereng rata-rata untuk dataset besar, metode dasar dirinci di sini. Namun, saya mulai bertanya-tanya apakah rata-rata harmonik mungkin lebih tepat daripada rata-rata aritmatika standar, karena secara teknis tingkat perubahannya. Saya belum melihat ini muncul dalam diskusi lain tentang rata-rata kemiringan pada titik, area, garis, dll. Ini seharusnya cukup mudah untuk dicapai.

sunting: Tujuan menghitung rata-rata kemiringan dalam kasus ini adalah untuk menghasilkan satu parameter (banyak) yang akan digunakan dalam pemodelan ambang inisiasi saluran. Saya memiliki satu set lokasi head-field yang dikumpulkan di lapangan yang akan saya kumpulkan akumulasi aliran, berbagai parameter tingkat ketinggian rata-rata, dll, dan akan menggunakan regresi linier berganda untuk mencoba menggambarkan ambang akumulasi dalam hal parameter lainnya.

Jay Guarneri
sumber
4
Tergantung pada mengapa Anda menghitung kemiringan rata-rata. Apa tujuannya? Berapa jumlah fisik yang Anda coba ukur? Meskipun banyak bentuk rata-rata adalah sah, waspadalah terhadap rata-rata harmonik: ia menyebabkan masalah ketika kemiringan nol, yang sering terjadi.
whuber

Jawaban:

10

Kemiringan rata-rata terdengar seperti kuantitas alami tetapi agak aneh. Misalnya, kemiringan rata-rata dataran horizontal rata adalah nol, tetapi ketika Anda menambahkan sedikit acak, suara rata-rata nol ke DEM dataran itu, kemiringan rata-rata hanya bisa naik. Perilaku aneh lainnya adalah ketergantungan kemiringan rata-rata pada resolusi DEM, yang telah saya dokumentasikan di sini , dan ketergantungannya pada bagaimana DEM dibuat. Sebagai contoh, beberapa DEM yang dibuat dari peta kontur sebenarnya sedikit bertingkat - dengan lompatan kecil yang tiba-tiba di mana garis kontur berada - tetapi sebaliknya merupakan representasi akurat dari permukaan secara keseluruhan. Lompatan tiba-tiba itu, jika diberi terlalu banyak atau terlalu sedikit bobot dalam proses rata-rata, dapat mengubah kemiringan rata-rata.

Meningkatkan bobot adalah relevan karena, pada dasarnya, rata-rata harmonik (dan cara lain) secara berbeda menimbang lereng. Untuk memahami hal ini, pertimbangkan rata-rata harmonik dari hanya dua bilangan positif x dan y . Menurut definisi,

Harmonic mean(x,y) = 1 / ((1/x + 1/y)/2) = x (y/(x+y)) + y (x/(x+y)) = a x + b y

di mana bobotnya adalah a = y / (x + y) dan b = x / (x + y). (Ini pantas disebut "bobot" karena mereka positif dan jumlah untuk kesatuan. Untuk rata-rata aritmatika, bobotnya adalah a = 1/2 dan b = 1/2). Terbukti, berat melekat pada x , sama dengan y / (x + y), besar ketika x adalah kecil dibandingkan dengan y . Dengan demikian harmonik berarti kelebihan nilai yang lebih kecil .

Mungkin membantu memperluas pertanyaan. Rata-rata harmonik adalah salah satu dari keluarga rata-rata yang diparameterisasi dengan nilai riil p . Sama seperti rata-rata harmonik diperoleh dengan rata-rata kebalikan dari x dan y (dan kemudian mengambil kebalikan dari rata-rata mereka), secara umum kita dapat rata-rata kekuatan p dari x dan y (dan kemudian mengambil kekuatan 1 / p dari hasil ). Kasus p = 1 dan p = -1 adalah masing-masing berarti aritmatika dan harmonik. (Kita dapat mendefinisikan rata-rata untuk p = 0 dengan mengambil batas dan dengan demikian memperoleh rata-rata geometris sebagai anggota keluarga ini juga.) Sebagai pberkurang dari 1, nilai-nilai yang lebih kecil semakin tertimbang berat; dan ketika p meningkat dari 1, nilai yang lebih besar semakin banyak tertimbang. Ini berarti bahwa rata-rata hanya dapat meningkat ketika p meningkat dan harus menurun ketika p menurun. (Ini terbukti pada gambar kedua di bawah ini, di mana ketiga garis datar atau meningkat dari kiri ke kanan.)

Mengambil pandangan praktis tentang masalah ini, kita bisa mempelajari perilaku berbagai cara lereng dan menambahkan pengetahuan ini ke kotak alat analisis kami: ketika kita berharap lereng masuk ke dalam suatu hubungan sedemikian rupa sehingga lereng yang lebih kecil harus diberikan lebih banyak dari sebuah pengaruh, kita dapat memilih rata-rata dengan p kurang dari 1; dan sebaliknya, kita dapat menambah p di atas 1 untuk menekankan lereng terbesar. Untuk tujuan ini, mari kita pertimbangkan berbagai bentuk profil drainase di sekitar suatu titik.

Untuk menunjukkan apa yang bisa terjadi, saya telah mempertimbangkan tiga medan lokal yang berbeda secara kualitatif : satu adalah tempat semua lereng sama (yang menjadi rujukan yang baik); yang lain adalah tempat di mana kita berada di dasar mangkuk: di sekitar kita lerengnya nol, tetapi kemudian secara bertahap meningkat dan akhirnya, di sekitar tepi, menjadi besar secara sewenang-wenang. Kebalikan dari situasi ini terjadi di mana lereng terdekat sedang tetapi kemudian turun dari kami. Itu tampaknya mencakup berbagai perilaku yang realistis.

Berikut adalah plot pseudo-3D dari ketiga jenis bentuk drainase ini:

Plot dalam 3D

Di sini saya telah menghitung rata-rata kemiringan masing-masing - dengan kode warna yang sama - sebagai fungsi p , membiarkan rentang p dari -1 (rata-rata harmonik) hingga 2.

Slope berarti vs p

Tentu saja garis biru itu horizontal: tidak peduli berapa nilai p yang diambil, rata-rata kemiringan konstan tidak boleh lain dari konstanta itu (yang telah ditetapkan ke 1 sebagai referensi). Lereng tinggi di sekitar tepi jauh dari mangkuk merah sangat mempengaruhi lereng rata-rata karena p bervariasi: perhatikan seberapa besar mereka menjadi setelah p melebihi 1. Pelek horizontal pada permukaan ketiga (emas-hijau) menyebabkan rata-rata harmonik (p = - 1) menjadi nol.

Patut dicatat bahwa posisi relatif dari tiga kurva berubah pada p = 0 (rata-rata geometris): untuk p lebih besar dari 0, mangkuk merah memiliki kemiringan rata-rata lebih besar daripada biru, sedangkan untuk p negatif , mangkuk merah memiliki rata-rata lebih kecil. kemiringan dari biru. Dengan demikian, pilihan p Anda bahkan dapat mengubah peringkat relatif lereng rata-rata.

Efek mendalam dari rata-rata harmonik (p = -1) pada bentuk kuning-hijau harus memberi kita jeda: ini menunjukkan bahwa ketika ada cukup banyak lereng kecil dalam drainase, rata-rata harmonik bisa sangat kecil sehingga melebihi pengaruh dari semua lereng lainnya.

Dengan semangat analisis data eksplorasi, Anda dapat mempertimbangkan berbagai p - mungkin membiarkannya berkisar dari 0 hingga sedikit lebih besar dari 1 untuk menghindari bobot ekstrem - dan menemukan nilai mana yang menciptakan hubungan terbaik antara kemiringan rata-rata dan variabel yang Anda adalah pemodelan (seperti ambang inisialisasi saluran). "Terbaik" biasanya dipahami dalam arti "paling linier" atau "menciptakan residu [homoseksual] yang konstan" dalam model regresi.

whuber
sumber
Terima kasih untuk analisis menyeluruh! Saya harus merenungkan ini sebentar.
Jay Guarneri
1

Saya melakukan pendekatan empiris untuk menemukan jawaban yang melengkapi jawaban teoritis yang sangat baik oleh whuber. Saya memutuskan untuk menghitung kemiringan dalam derajat dan rata-rata yang menggunakan rata-rata sudut . Selanjutnya, saya menghitung aritmatika dan rata-rata harmonik dari persen kemiringan yang saya buat satu set titik sampel yang terletak secara acak di wilayah studi. Saya meminta 2000 poin dengan jarak minimum 100m, yang menghasilkan 1.326 poin. Saya mencicipi nilai dari masing-masing rata-rata lereng raster di setiap titik, dan mengkonversi persentase rata-rata menjadi derajat menggunakan rumus Degrees = atan(percent/100). Asumsi saya di sini adalah bahwa sudut rata-rata akan menghasilkan kemiringan rata-rata "benar" dalam derajat, dan persentase rata-rata mana pun yang mendekati itu akan menjadi prosedur yang benar.

Selanjutnya, saya membandingkan semua nilai bukan nol menggunakan tes Kruskal-Wallace (asumsi adalah bahwa untuk sebagian besar nilai kemiringan nol, itu akan menjadi nol di ketiga, dan bahwa nilai nol akan menutupi perbedaan antara metode). Saya menemukan perbedaan yang signifikan antara ketiganya (chi-square = 17,9570, DF = 2, p = 0,0001), jadi saya lebih lanjut memeriksa data menggunakan Prosedur Dunn menggunakan alpha = 0,05 (Elliot dan Hynan 2011) . Hasil akhirnya adalah bahwa rata-rata aritmatika dan harmonik berbeda secara signifikan satu sama lain, tetapi lebih berbeda secara signifikan dari rata-rata sudut:

Comparison           Diff        SE        q         q(0.05)    Conclude                      
------------------------------------------------------------------------------                
arith     harm      164.12    38.78     4.23       2.394    Reject                            
arith     angular   75.3      38.8      1.94       2.394    Do not reject                     
angular   harm      88.82     38.68     2.3        2.394    Do not reject                     

Jika asumsi saya semuanya benar (mungkin sangat tidak benar), ini berarti bahwa sementara harmonik dan aritmatika berarti menciptakan nilai yang berbeda satu sama lain, mereka berdua "dekat" dengan rata-rata sudut agar dapat diterima. Ada dua peringatan lain di sini yang dapat saya pikirkan (tolong tambahkan yang lain jika Anda memikirkannya):

  1. Ukuran sampel yang lebih besar mungkin menemukan perbedaan yang signifikan antara persentase rata-rata dan rata-rata sudut. Namun, ukuran sampel saya adalah ~ 1000 poin hanya untuk nilai bukan nol.
  2. Karena titik sampel saya ditempatkan tanpa memperhatikan cekungan drainase, mungkin ada beberapa replikasi semu yang terlibat, karena setiap lereng rata-rata akan terkait dengan lereng rata-rata di atasnya.
Jay Guarneri
sumber
1
Ini menarik (+1), tetapi waspadai batasannya. (1) Ya, jika Anda memilih ukuran sampel yang lebih besar, Anda akan menemukan bahwa semua perbedaan itu signifikan. Karena itu tidak masuk akal untuk melakukan uji hipotesis statistik: Anda ingin fokus pada jumlah perbedaan di antara prosedur. (2) Hasil Anda sepenuhnya bergantung pada properti sebenarnya dari data Anda. Mereka akan berbeda dengan dataset lain. (3) Mean sudut berguna sebagai referensi tetapi tidak berarti nilai yang lebih disukai. Yang digunakan sebagai referensi tergantung sepenuhnya pada bagaimana rata-rata akan digunakan dalam analisis atau pemetaan lebih lanjut.
whuber
0

Dengan asumsi bahwa tidak ada parameter yang menentukan kemiringan yang diketahui, ahli statistik mana pun akan mengatakan untuk menggunakan kemiringan yang meminimalkan penyimpangan RMS dari data darinya. (Tentu saja, contoh whuber tidak memenuhi syarat karena dia memilih bentuk lahan yang dihasilkan secara matematis, tetapi untuk bentuklahan nyata asumsi parameter yang tidak diketahui harus valid.)

johnsankey
sumber
Balasan ini dihargai, tapi saya pikir itu salah paham situasinya. Paling signifikan, lereng ini tidak digunakan untuk mencocokkan kurva: konsep "penyimpangan RMS data" tidak berlaku. Kedua, saya telah memilih tipe bentuk lahan kualitatif untuk menjangkau spektrum luas dari apa yang benar-benar akan ditemui, jadi saya mempertahankan mereka memberikan informasi yang berguna tentang apa yang diharapkan. Dataset nyata tidak berkontribusi banyak untuk memahami apa yang terjadi di sini, karena tidak ada yang namanya lereng rata-rata "benar". Pertanyaan utamanya adalah rata-rata apa yang berguna atau informatif.
whuber
1
BTW, saya percaya saya memiliki beberapa kualifikasi sebagai ahli statistik. Itu tidak membuat pendapat saya tentang masalah ini menjadi lebih baik atau lebih buruk: seperti orang lain, saya harus mendukungnya sejelas dan seobjektif mungkin, dan saya cukup rentan untuk salah dan harus mengubah pikiran saya: - ). Saya hanya menawarkan poin ini sebagai tanggapan terhadap komentar "ahli statistik" Anda.
whuber
Pertanyaan yang cocok menurut saya, tergantung, apa kemiringan lereng yang akan digunakan. Untuk potensi kemerosotan lahan, misalnya, lereng yang lebih curam akan diberi bobot lebih tinggi dibandingkan dengan lereng ringan sesuai dengan model potensi kemerosotan vs lereng, maka pendekatan kesesuaian RMS harus valid. Model pembobotan lainnya akan digunakan untuk mencocokkan kegunaan lain. Singkatnya, modelkan semua yang kita ketahui dengan pembobotan atau cara lain, lalu andalkan RMS sebagai model untuk semua yang tidak kita ketahui, itulah yang saya sarankan.
johnsankey
Saya setuju dengan premis dari komentar itu, John, tetapi saya tidak melihat bagaimana kesimpulan Anda. Jika kemiringan yang lebih curam adalah untuk menerima bobot yang lebih berat, maka tampaknya RMS adalah apa yang tidak ingin Anda lakukan, karena ia menimbang semua penyimpangan secara merata, terlepas dari kemiringannya. Selain itu, RMS, sebagai fungsi kerugian kuadratik, tidak dapat menjadi pengganti universal untuk apa yang dapat dicapai teknik lain, termasuk ekspresi ulang nonlinier dari lereng dan penggunaan fungsi kehilangan alternatif (seperti yang dieksploitasi oleh metode pemasangan yang kuat misalnya).
whuber
RMS mencakup bobot
johnsankey