Pelaporan hasil kurva-fit dalam makalah ilmiah

(Saya harap pertanyaan ini cocok dengan situs ini; jika tidak, terima permintaan maaf saya).

Saya menjalankan simulasi tertentu, dan mendapat deret waktu y (t), t = 0, 1, ... 20. Setelah mencoba beberapa fungsi, saya menemukan bahwa:

y(t) =~ 1 / (A t + B)

Di mana A dan B adalah koefisien yang saya hitung menggunakan regresi linier, dengan R ^ 2> 0,99.

Apa cara standar untuk melaporkan hasil tersebut dalam makalah ilmiah? Secara khusus:

A. Saya tidak punya penjelasan teoretis, mengapa outputnya terlihat seperti ini (saya tahu itu harus berkurang, dan itu dibatasi dari bawah, tetapi tidak lebih). Itu hanya tebakan yang berhasil. Haruskah saya menggambarkan semua tebakan yang gagal yang saya coba?

B. Setiap kali saya menjalankan simulasi, saya mendapatkan nilai A dan B. yang sedikit berbeda. Haruskah saya melaporkan menjalankan acak saja, atau haruskah saya menjalankan simulasi berkali-kali dan rata-rata hasilnya? Jika demikian, berapa kali sudah cukup?

regression publications Erel Segal-Halevi
sumber

Apa yang ingin Anda sampaikan? Apa yang diwakili oleh masing-masing simulasi individu?

Bill Barth

Ini adalah simulasi kepemilikan tanah. Ada N warga dan N plot tanah. Awalnya, setiap plot tanah diberikan kepada warga negara secara acak. Kemudian, setiap tahun, setiap lahan dijual dengan probabilitas p tertentu, dan jika memang dijual, pembeli dipilih secara acak. Setelah 50 tahun, saya menjalankan prosedur "Yobel" di mana beberapa tanah dikembalikan ke pemilik aslinya, jika pemilik saat ini tidak memiliki tanah. Saya mengukur jumlah warga tanpa tanah (y) setelah setiap Yobel (t). Tentu saja y (t) tidak meningkat. Saya ingin menunjukkan bahwa itu menurun dalam tingkat yang dapat diprediksi, dan bahwa itu konvergen ke 0.

Erel Segal-Halevi

A

$A$

B

$B$

x_{n}

$x_n$

n = 0 \dots N

$n=0\dots N$

n

$n$

Bill: maksud Anda saya harus menghitung A dan B berkali-kali, lalu melaporkan mean dan std? Saya pikir pendekatan yang lebih baik adalah dengan melakukan regresi linier tunggal dengan semua sampel dari semua simulasi. Tetapi berapa kali saya harus menjalankan simulasi?

Erel Segal-Halevi

Jawaban:

Anda mencoba menyesuaikan hukum kekuasaan dengan distribusi Anda. Sangat menarik. Ini muncul sepanjang waktu dalam teori grafik , jejaring sosial , dan banyak tempat lain.

Ada beberapa tutorial tentang pemasangan data Anda di sini dan di sini .

Juga, sehubungan dengan pertanyaan A., bagaimana probabilitas seseorang membeli tanah tergantung pada berapa banyak tanah yang sudah mereka miliki? Anda mungkin dapat menggunakan model Barbasi untuk menjelaskan mengapa undang-undang kekuasaan cocok dengan data Anda.

pembaruan: Saya telah menggunakan ini dan berfungsi dengan baik: https://pypi.python.org/pypi/powerlaw

dranxo
sumber

+1 untuk semua tautan! Saya juga memikirkan hukum kekuasaan, tetapi bentuk sederhana (y = A t ^ k) tidak memerlukan bentuk yang saya temukan, karena konstanta B (y = (A t + B) ^ - 1). Apakah ada bentuk yang lebih umum?

Erel Segal-Halevi

Jika Anda tertarik untuk mendeskripsikan bentuk kurva maka Anda harus memfaktorkan dan bergeser sebelum memasang hukum daya. Fakta bahwa Anda memiliki B tidak relevan dengan bentuk kurva.

dranxo

Maaf, saya tidak mengerti Anda, apa yang Anda maksud dengan "maka Anda harus memfaktorkan dan bergeser"?

Erel Segal-Halevi

Set x = t + B / A. Kemudian (Di + B) ^ {- 1} = (A * x) ^ {- 1} yang merupakan formulir dalam tautan.

dranxo

tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf

dranxo

Beberapa pemikiran tentang pertanyaan Anda:

Bagaimana Anda melaporkan kecocokan model Anda akan sangat tergantung pada audiens Anda, dan bidang Anda. Misalnya, di bidang saya, statistik model fit seperti R ^ 2 sangat jarang dilaporkan - dianggap tidak mengesankan atau sangat berguna. Alih-alih, beberapa kriteria untuk bagaimana Anda sampai pada model yang Anda pilih cenderung dijelaskan, dan kemudian Anda melaporkan hasil model Anda - kami semua menganggap Anda benar-benar cocok dengan model tersebut.
"Saya kebetulan di formulir ini" adalah penjelasan yang buruk. Benar-benar buruk. Terlepas dari kesukaan akan cerita-cerita tentang kejeniusan yang tidak disengaja, seperti penemuan penisilin atau kina, "keberuntungan buta yang bodoh" bukanlah proses ilmiah yang dapat diandalkan. Misalnya, Anda telah menunjukkan bahwa formulir itu bagus untuk menyesuaikan data Anda, tetapi Anda belum menunjukkan yang terbaik untuk memasang data Anda. R ^ 2 saja bukan metrik yang cukup untuk mengevaluasi seberapa baik model Anda cocok dengan data. Lihat kuartet Anscombe .
Seperti yang disebutkan @rcompton, sepertinya Anda mencoba menyesuaikan distribusi hukum daya tanpa menyadarinya, tetapi bahkan jika Anda berhasil menyesuaikan dengan hukum kekuatan, sebaiknya jika Anda menemukan alasan mengapa Anda menganggapnya sebagai hukum kekuatan . Mungkin cukup untuk merencanakan Y dari waktu ke waktu, menuju ke CrossValidated (atau perguruan tinggi / departemen yang lebih nyaman dengan statistik) dan secara sistematis memeriksa distribusi yang mungkin memberi Anda tampilan yang kurang lebih sama. Ada yang lain selain distribusi kuasa hukum yang mungkin memberi Anda lebih unggul.

Fomite
sumber

+1 untuk wawasan. "Secara sistematis pergilah distribusi yang mungkin memberi Anda tampilan yang kira-kira." - di mana saya dapat menemukan ini?

Erel Segal-Halevi

@ErelSegalHalevi Anda mungkin mulai di CrossValidated, situs-situs saudara ini yang menyangkut statistik dan analisis data.

Fomite