Saya telah mencoba untuk membangun ketidaksetaraan
di mana adalah mean sampel dan standar deviasi sampel, yaitu .
Sangat mudah untuk melihat bahwa dan seterusnya tapi ini tidak terlalu dekat dengan apa yang saya cari, juga bukan ikatan yang berguna. Saya telah bereksperimen dengan Cauchy-Schwarz dan ketidaksetaraan segitiga tetapi tidak ke mana-mana. Pasti ada langkah halus yang saya lewatkan di suatu tempat. Saya akan sangat menghargai bantuan, terima kasih.
Setelah menyederhanakan masalah dengan cara prosedur rutin, itu dapat diselesaikan dengan mengubahnya menjadi program minimisasi ganda yang memiliki jawaban terkenal dengan bukti dasar. Mungkin dualisasi ini adalah "langkah halus" yang disebutkan dalam pertanyaan. Ketidaksetaraan juga dapat dibangun dengan cara yang murni mekanis dengan memaksimalkanmelalui pengganda Lagrange.|Ti|
Pertama, saya menawarkan solusi yang lebih elegan berdasarkan geometri kuadrat terkecil. Ini tidak memerlukan penyederhanaan awal dan hampir segera, memberikan intuisi langsung ke hasilnya. Seperti yang disarankan dalam pertanyaan, masalahnya berkurang pada ketimpangan Cauchy-Schwarz.
Solusi geometris
Pertimbangkan sebagai vektor dimensi dalam ruang Euclidean dengan produk titik yang biasa. Biarkan menjadi vektor dasar dan . Tulis dan untuk proyeksi ortogonal dari dan ke dalam komplemen ortogonal dari . (Dalam terminologi statistik, mereka adalah residu sehubungan dengan sarana.) Kemudian, karena dann y = ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) i th 1 = ( 1 , 1 , ... , 1 ) x y x y 1 X i - ˉ X =x=(X1,X2,…,Xn) n y=(0,0,…,0,1,0,…,0) ith 1=(1,1,…,1) x^ y^ x y 1 S=| | x | | /√Xi−X¯=x^⋅y S=||x^||/n−1−−−−−√ ,
adalah komponen dalam arah . Oleh Cauchy-Schwarz, ini dimaksimalkan tepat ketika sejajar dengan , untuk itu QED. x x y =(-1,-1,...,-1,n-1,-1,-1,...,-1)/nTi=±√y^ x^ x^ y^= ( - 1 , - 1 , … , - 1 , n - 1 , - 1 , - 1 , … , - 1 ) / n
Kebetulan, solusi ini memberikan karakterisasi lengkap dari semua kasus di manadimaksimalkan: mereka semua berbentuk| Tsaya|
untuk semua nyata .μ , σ
Analisis ini digeneralisasikan dengan mudah ke kasus di mana digantikan oleh setiap set regressor. Jelas maksimum sebanding dengan panjang sisa ,.T i y | | y | |{ 1 } Tsaya y | | y^| |
Penyederhanaan
Karena adalah invarian di bawah perubahan lokasi dan skala, kami dapat mengasumsikan tanpa kehilangan keumuman bahwa jumlah menjadi nol dan kuadratnya berjumlah . Ini mengidentifikasidengan, karena (mean square) adalah . Memaksimalkan itu sama dengan memaksimalkan . Tidak ada generalisasi yang hilang dengan mengambil , karena dapat ditukar.X i n - 1 | T i | | X i | S 1 | T i | 2 = T 2 i = X 2 i i = 1 X iTsaya Xsaya n - 1 | Tsaya| | Xsaya| S 1 | Tsaya|2= T2saya= X2saya i = 1 Xsaya
Solusi melalui formulasi ganda
Masalah ganda adalah untuk memperbaiki nilai dan menanyakan nilai tersisa diperlukan untuk meminimalkan jumlah kuadrat mengingat bahwa . Karena diberikan, ini adalah masalah meminimalkan mengingat bahwa . X j , j ≠ 1 ∑ n j = 1 X 2 j ∑ n j = 1 X j = 0 X 1 ∑ n j = 2 X 2 j ∑ n j = 2 X j = - X 1X21 Xj, j ≠ 1 ∑nj = 1X2j ∑nj = 1Xj= 0 X1 ∑nj = 2X2j ∑nj = 2Xj= - X1
Solusinya mudah ditemukan dalam banyak cara. Salah satu yang paling dasar adalah menulis
yang . Memperluas fungsi objektif dan menggunakan jumlah-ke-nol identitas ini untuk menyederhanakannya menghasilkan∑nj=2εj=0
segera menampilkan solusi unik adalah untuk semua . Untuk solusi ini,jεj=0 j
dan
QED .
Solusi melalui mesin
Kembali ke program sederhana yang kami mulai dengan:
tunduk pada
Metode pengganda Lagrange (yang hampir murni mekanis dan langsung) menyamakan kombinasi linier nontrivial dari gradien dari ketiga fungsi ini menjadi nol:
Komponen demi komponen, persamaan ini adalahn
Yang terakhir dari mereka menyiratkan baik atau . (Kami dapat mengesampingkan kasus terakhir karena persamaan pertama menyiratkan , meremehkan kombinasi linear.) Batasan jumlah-ke-nol menghasilkan . Batasan jumlah-dari-kotak menyediakan dua solusiX 2 = X 3 = ⋯ = X n = - λ 2 / ( 2 λ 3 ) λ 2 = λ 3 = 0 λ 1 = 0 X 1 = - ( n - 1 ) X 2n - 1 X2= X3= ⋯ = Xn= - λ2/ (2 λ3) λ2= λ3= 0 λ1= 0 X1= - ( n - 1 ) X2
Keduanya menghasilkan
sumber
Ketidaksetaraan seperti yang dinyatakan benar. Sangat jelas secara intuitif bahwa kita mendapatkan kasus yang paling sulit untuk ketidaksetaraan (yaitu, memaksimalkan sisi hannd kiri untuk diberikan ) dengan memilih satu nilai, katakanlah sebesar mungkin, sementara semua yang lain sama. Mari kita lihat contoh dengan konfigurasi seperti ini:x 1S2 x1
| x i - ˉ x |
EDIT
Kami sekarang akan membuktikan klaim, seperti yang ditunjukkan di atas. Pertama, untuk setiap vektor dalam masalah ini, kita dapat menggantinya dengan tanpa mengubah sisi ketidaksamaan di atas. Jadi, berikut ini mari kita asumsikan bahwa . Kita juga dapat dengan relabelling berasumsi bahwa adalah yang terbesar. Kemudian, dengan memilih dan kemudian kita dapat memeriksa dengan aljabar sederhana bahwa kita memiliki kesetaraan dalam ketidaksetaraan yang diklaim. Jadi, itu tajam.x = ( x1, x2, ... , xn) x - x¯ x¯= 0 x1 x1> 0 x2= x3= ⋯ = xn= - x1n - 1
Kemudian, tentukan wilayah (cembung) oleh untuk konstanta positif yang diberikan . Perhatikan bahwa adalah persimpangan hyperplane dengan bola yang berpusat di titik asal, begitu juga bola di -ruang. Masalah kita sekarang dapat dirumuskan sebagai sejak suatuR = { x ∈ R : ˉ x = 0 , ∑ ( x i - ˉ x ) 2 / ( n - 1 ) ≤ S 2 } S 2 R ( n - 1 ) maks x ∈ R maks i | x i | x R | x 1 |R
sumber