Izinkan saya mengklarifikasi:
Diberikan sebaran beberapa titik tertentu n, jika saya ingin menemukan titik terdekat dengan titik mana pun dalam plot secara mental, saya dapat langsung mengabaikan sebagian besar titik dalam grafik, mempersempit pilihan saya ke beberapa titik kecil yang konstan di sekitar .
Namun, dalam pemrograman, diberikan satu set titik n, untuk menemukan titik terdekat dengan titik mana pun, diperlukan pengecekan setiap titik lainnya, yaitu waktu.
Saya menduga bahwa tampilan visual grafik kemungkinan setara dengan beberapa struktur data yang tidak dapat saya pahami; karena dengan pemrograman, dengan mengonversi poin ke metode yang lebih terstruktur seperti quadtree, seseorang dapat menemukan titik terdekat ke titik dalam dalam waktu , atau diamortisasi waktu.n k ⋅ log ( n ) O ( log n )
Tetapi masih belum ada algoritma amortisasi diketahui (yang dapat saya temukan) untuk pencarian titik setelah restrukturisasi data.
Jadi mengapa ini tampak mungkin hanya dengan inspeksi visual?
Jawaban:
Model Anda tentang apa yang Anda lakukan secara mental tidak benar. Bahkan, Anda beroperasi dalam dua langkah:
Jika Anda pernah bermain gim seperti pétanque (mangkuk) atau keriting, ini seharusnya sudah biasa - Anda tidak perlu memeriksa benda-benda yang sangat jauh dari target, tetapi Anda mungkin perlu mengukur pesaing terdekat.
Untuk menggambarkan titik ini, titik hijau mana yang paling dekat dengan titik merah? (Hanya dengan sedikit lebih dari 1 piksel, tetapi ada satu yang paling dekat.) Untuk mempermudah, titik-titik tersebut bahkan diberi kode warna berdasarkan jarak.
Gambar ini berisi titik yang hampir berada di lingkaran, dan titik hijau secara total. Langkah 1 memungkinkan Anda menghilangkan semua kecuali tentang poin , tetapi langkah 2 membutuhkan memeriksa setiap poin . Tidak ada apriori yang terikat untuk .n ≫ 10 m m mm=10 n≫10 m m m
Pengamatan fisik memungkinkan Anda mengecilkan ukuran masalah dari seluruh set poin ke set kandidat terbatas poin . Langkah ini bukan langkah perhitungan seperti yang biasa dipahami, karena didasarkan pada proses yang berkelanjutan. Proses berkelanjutan tidak tunduk pada intuisi biasa tentang kompleksitas komputasi dan khususnya analisis asimptotik.mn m
Sekarang, Anda mungkin bertanya, mengapa proses yang berkelanjutan tidak dapat menyelesaikan masalah sepenuhnya? Bagaimana sampai pada poin ini , mengapa kita tidak bisa memperbaiki proses untuk mendapatkan ?m = 1m m=1
Jawabannya adalah bahwa saya sedikit curang: Saya menyajikan satu set poin yang dihasilkan terdiri dari poin yang paling dekat dan poin yang lebih jauh. Secara umum, menentukan titik mana yang berada dalam batas yang tepat membutuhkan pengamatan yang tepat yang harus dilakukan poin demi poin. Proses eliminasi yang kasar memungkinkan Anda mengecualikan banyak kandidat yang bukan kandidat, tetapi hanya menentukan kandidat mana yang tersisa yang perlu disebutkan.n - mm n−m
Anda dapat memodelkan sistem ini dalam dunia komputasi yang terpisah. Asumsikan bahwa titik-titik diwakili dalam struktur data yang mengurutkannya menjadi sel-sel pada kisi, yaitu titik disimpan dalam daftar untuk sel . Jika Anda mencari titik yang paling dekat dengan dan sel yang berisi titik ini paling banyak berisi satu titik lain, maka itu sudah cukup untuk memeriksa sel yang berisi dan 8 sel tetangga. Jumlah total poin dalam 9 sel ini adalah . Model ini menghormati beberapa sifat utama dari model manusia:( ⌊ x ⌋ , ⌊ y ⌋ ) ( x 0 , y 0 ) m(x,y) (⌊x⌋,⌊y⌋) (x0,y0) m
sumber
Alasannya adalah bahwa data telah dimasukkan ke dalam "struktur data" yang dioptimalkan untuk permintaan ini dan bahwa waktu preprocessing dalam mempersiapkan grafik harus dimasukkan dalam waktu yang diukur yang sebanding dengan jumlah titik, memberikan O (n) kompleksitas di sana.
Jika Anda meletakkan koordinat dalam tabel yang mencantumkan koordinat X dan Y dari setiap titik, Anda akan membutuhkan upaya mental yang jauh lebih besar untuk menghitung jarak antar titik, mengurutkan daftar jarak dan memilih yang terkecil.
Sebagai contoh dari kueri yang tidak berfungsi dengan baik secara visual, akan melihat langit malam dan - berdasarkan hanya pada tampilan Anda dan tabel koordinat masing-masing bintang - temukan bintang terdekat dengan Bumi atau tanda astrologi memiliki jarak terkecil antara bintang-bintang itu terdiri dari. Di sini Anda akan memerlukan model 3D yang dapat diperbesar dan dapat diputar untuk menentukan ini secara visual, di mana komputer akan menganggap ini pada dasarnya masalah yang sama seperti aslinya.
sumber
Pertanyaan ini dimulai dari premis yang salah. Anda hanya berpikir secara mental Anda dapat menemukan titik terdekat dalam poin , tetapi pada kenyataannya, jika Anda tidak bisa. Rasanya seperti itu karena Anda terbiasa berurusan dengan grafik yang sangat kecil, tetapi contoh-contoh kecil bisa menyesatkan, ketika kita berurusan dengan kompleksitas asimptotik. Jika Anda mencoba melakukan ini dengan plot sebaran dengan satu miliar poin, Anda akan segera menemukan bahwa Anda tidak dapat melakukannya dalam waktu .O ( 1 )O(1) O(1)
sumber
O(numberOfPointsAboutTheSameDistanceFromTheTargetPointAsTheClosestPoint)
, yang belum tentu terkaitn
. Either way, saya pikir jawaban untuk ini harus menyajikan struktur data yang mungkin dalam hal bagaimana pikiran manusia merasakan dan mempertanyakannya. Cukup mengatakan itu bukan O (1) terasa ... malas? tidak memadai?Keunggulan inspeksi visual bergantung pada tempat-tempat penting yang tidak dapat dijamin secara umum:
hitung : (lih. komentar Nick Alger pada jawaban yang diberikan oleh DW) mengasumsikan jumlah poin melebihi jumlah sel retina Anda - Anda bahkan tidak akan mengidentifikasi semua poin yang terlibat.
varians : (lih. komentar Nick Alger pada jawaban yang diberikan oleh DW) mengasumsikan satu set poin pada kisi reguler (misalnya heksagonal) yang menjadi sasaran gangguan acak kecil. jika gangguan ini menjadi kurang dari resolusi retina Anda (atau grid overlay lainnya), Anda tidak hanya akan kesulitan untuk mendeteksi jarak minimum aktual tetapi memilih pasangan poin yang salah dengan probabilitas tinggi.
sumber
Komputer sedang memecahkan masalah yang berbeda. Dibutuhkan daftar poin, bukan gambar poin raster. Konversi dari daftar ke gambar, yaitu "memplot" titik, membutuhkan
O(n)
waktu.Cepat! Yang paling dekat dengan (1,2):
Jauh lebih sulit, bukan? Saya yakin jika saya membuat daftar dua kali lebih lama Anda harus melakukan dua kali lebih banyak pekerjaan.
Anda tidak menyadari seberapa banyak pekerjaan yang dilakukan otak Anda. Anda tidak "hanya tahu" titik mana yang lebih dekat. Otak Anda sedang melakukan pekerjaan komputasi untuk mencari tahu jawaban itu dan membuatnya tersedia. Otak bekerja pada setiap titik secara paralel, sehingga waktu untuk menyelesaikannya kira-kira sama, tetapi jumlah pekerjaan yang dibutuhkan masih meningkat seiring dengan jumlah titik.
sumber
Untuk alasan yang sama ketika Anda melihat sebuah segitiga dan tahu itu adalah segitiga, Anda melupakan jutaan perhitungan yang Anda lakukan tanpa menyadarinya.
Jaringan saraf
Akibatnya Anda adalah jaringan saraf yang telah dilatih dan sarat dengan massa pada massa data.
Ambil game pengurutan bentuk bayi sebagai contoh:
Ketika seorang anak pertama kali berinteraksi dengan ini, kemungkinan mereka akan berusaha memasukkan bentuk ke dalam lubang yang salah, ini karena mereka belum melatih otak mereka atau menemukan cukup data untuk membangun jaringan. Mereka tidak dapat membuat asumsi tentang tepi, ukuran, dll. Untuk menentukan bentuk mana yang cocok dengan lubang.
Ini nampak jelas bagi Anda (saya harap) karena Anda telah membangun koneksi ini, Anda bahkan mungkin berpikir itu intuitif dan tidak perlu memecahnya, misalnya Anda hanya tahu segitiga cocok dengan segitiga dan tidak perlu memperkirakan ukurannya. , hitung ujungnya, .etc. Ini tidak benar, Anda telah melakukan semua itu di alam bawah sadar Anda, satu-satunya pikiran sadar yang Anda miliki adalah segitiga. Berjuta-juta perhitungan terjadi dari mengambil representasi visual, memahami apa yang diwakilinya, memahami apa elemen individu dan kemudian memperkirakan jarak mereka, fakta bahwa Anda memiliki database besar informasi untuk polling membuatnya lebih sederhana.
Otakmu bukan biner
Data yang bekerja di otak Anda bukan biner (Sejauh yang kami tahu), tidak benar atau salah, ia menyatakan banyak negara yang kami gunakan untuk menginterpretasikan data, kami juga sering melakukan kesalahan, bahkan ketika kami mengikuti yang benar proses, ini karena data sering berubah. Saya akan menebak bahwa otak kita berfungsi lebih seperti komputer kuantum di mana bit berada dalam keadaan perkiraan sampai dibaca. Artinya, jika otak kita bekerja seperti komputer sama sekali, itu benar-benar tidak diketahui.
Karenanya suatu algoritma untuk bekerja dengan data biner tidak akan berfungsi sama. Anda tidak dapat membandingkan keduanya. Di kepala Anda, Anda menggunakan konsep untuk melakukan, tipe data kaya yang menyimpan lebih banyak informasi, Anda memiliki kemampuan untuk membuat tautan di mana mereka tidak didefinisikan secara eksplisit; saat melihat segitiga Anda mungkin berpikir tentang sisi Gelap Pink Floyd dari penutup bulan.
Kembali ke grafik sebar, tidak ada alasan Anda tidak bisa melakukan ini di komputer menggunakan bitmap dan mengukur jarak dari suatu titik dalam meningkatkan jari-jari sampai Anda menemukan titik lain. Ini mungkin yang terdekat dengan perkiraan manusia. Ini mungkin jauh lebih lambat karena keterbatasan data dan karena otak kita tidak perlu peduli dengan kompleksitas komputasi dan mengambil rute yang rumit untuk melakukan sesuatu.
Bukan O (1), atau bahkan O (n) jika n adalah jumlah titik, sebaliknya kompleksitasnya sekarang tergantung pada jarak linear maksimum dari titik yang dipilih ke batas gambar.
tl; dr
Otak Anda bukan komputer biner.
sumber
Anda lupa satu langkah penting: memplot semua titik itu pada grafik yang Anda lihat.
ini karena kebutuhan operasi O (n).
setelah ini komputer dapat menggunakan perangkat lunak pengenal gambar untuk menemukan titik perkiraan terdekat ke pusat dengan cara yang sama seperti mata manusia. Ini adalah kasus terburuk operasi O (sizeOfImage).
bagi manusia untuk melakukan hal yang sama seperti komputer ingat bahwa komputer mendapatkan daftar koordinat dan hanya dapat melihat satu pada saat itu.
sumber
Interpretasi saya atas pertanyaan:
Saya tidak percaya pertanyaan ini harus disederhanakan sebagai masalah kompleksitas geometri komputasi. Itu harus dipahami dengan lebih baik dengan mengatakan: kita merasakan kemampuan untuk menemukan jawaban dalam waktu yang konstan, ketika kita bisa. Apa yang menjelaskan persepsi ini, dan hingga penjelasan ini serta keterbatasan manusia, dapat dilakukan komputer juga.
Ini mungkin diperkuat oleh hukum Weber-Fechner , yang menyatakan bahwa persepsi kita harus diukur pada skala logaritmik dari ukuran fisik aktual. Dengan kata lain, kami mempersepsikan variasi relatif daripada variasi absolut. Ini misalnya mengapa intensitas suara diukur dalam desibel.
Mempertimbangkan keterbatasan fisiologis
Kesimpulan di atas lebih lanjut dipertahankan ketika mempertimbangkan langkah-langkah akuisisi gambar.
OP berhati-hati untuk memisahkan konstruksi struktur data yang tepat, "seperti quadtree", yang diamortisasi pada beberapa pertanyaan.
Ini tidak berfungsi untuk kebanyakan orang yang tidak menghafal gambar. Saya pikir gambar dipindai untuk setiap permintaan, tetapi itu tidak menyiratkan pemindaian semua poin: bukan yang pertama kali, dan bukan untuk permintaan nanti.
Tanpa mengetahui unit aktual yang akan digunakan, ini hanya menunjukkan bahwa variasi untuk pemrosesan paling buruk berada pada urutan yang sama dengan operasi waktu konstan lainnya. Oleh karena itu, sangat wajar bahwa waktu yang dirasakan untuk menemukan titik terdekat terasa konstan. . . apakah kita menentukan titik terdekat atau hanya satu set titik terdekat.
Tentang contoh tandingan dan kemungkinan solusi
Tentu saja mudah untuk membangun contoh tandingan yang membuat penentuan mata dari titik terdekat menjadi sangat sulit di antara sekumpulan kecil titik terdekat. Inilah sebabnya mengapa OP sebenarnya meminta algoritma yang menghilangkan sebagian besar poin dengan cepat, kecuali yang terdekat. Masalah kemungkinan kesulitan memilih di antara beberapa titik dekat ini ditekankan dalam banyak jawaban, dengan contoh paradigmatik dari titik terdekat yang hampir berada pada lingkaran di sekitar titik referensi. Biasanya hukum Weber-Fechner menghalangi untuk bisa membedakan variasi jarak kecil pada jarak yang cukup jauh. Efek ini sebenarnya dapat ditingkatkan dengan adanya titik-titik lain yang, meskipun dihilangkan, dapat merusak persepsi jarak. Jadi mencoba mengidentifikasi titik terdekat akan menjadi tugas yang lebih sulit, dan mungkin memerlukan langkah-langkah pemeriksaan khusus, seperti menggunakan instrumen, yang akan sepenuhnya menghancurkan perasaan waktu yang konstan. Tetapi tampaknya jelas di luar kisaran percobaan yang dipertimbangkan oleh OP, karenanya tidak terlalu relevan.
Pertanyaan untuk dijawab , yang merupakan pertanyaan yang sebenarnya ditanyakan oleh OP, adalah apakah ada cara untuk menghilangkan sebagian besar poin, kecuali mungkin untuk beberapa yang tersisa yang tampaknya memiliki jarak yang sangat mirip dengan titik referensi.
Menolak biaya diamortisasi tidak memungkinkan untuk solusi komputer, karena semua poin harus diperhatikan. Ini menggarisbawahi perbedaan utama dalam daya komputasi otak dan persepsi manusia: ia dapat menggunakan komputasi analog dengan sifat-sifat yang sangat berbeda dari komputasi digital . Ini biasanya terjadi ketika miliaran titik tidak dapat dibedakan oleh mata, yang tidak memiliki resolusi untuk melihat apa pun kecuali awan besar dengan berbagai nuansa gelap. Tetapi mata kemudian dapat fokus pada bagian yang lebih kecil yang relevan, dan melihat sejumlah titik yang dibatasi, yang mengandung titik yang relevan. Itu tidak harus mengetahui semua poin secara individual. Agar komputer melakukan hal yang sama, Anda harus memberikannya sensor yang sama, daripada koordinat numerik yang tepat dari setiap titik. Ini masalah yang sangat berbeda.
"Mere inspeksi visual" dalam beberapa hal jauh lebih kuat daripada perhitungan digital. Dan itu juga disebabkan oleh fisika sensor, bukan hanya karena kekuatan komputasi yang mungkin lebih besar dari otak.
sumber
Kami memiliki siswa dalam ujian yang, ketika ditanya seberapa cepat Anda dapat mengurutkan array, akan mengklaim bahwa komputer itu bodoh, dan membutuhkan n * log (n) (atau lebih buruk), sementara manusia dapat melakukannya lebih cepat.
Jawaban profesor saya selalu: Saya akan memberikan daftar 10.000 item. Mari kita lihat apakah Anda dapat menemukan metode yang lebih cepat dari apa yang akan dilakukan komputer.
Dan kemudian: berapa banyak inti pemrosesan yang terlibat ketika Anda mencoba menemukan titik terdekat? Anda bukan mesin prosesor tunggal, Anda memiliki jaringan saraf, yang memiliki beberapa fleksibilitas ketika datang ke tugas-tugas seperti ini.
sumber
Saya percaya @ Patrick87 memberi Anda petunjuk: mata dan otak Anda adalah mesin komputasi paralel masif. Beberapa berpendapat bahwa ini tidak menjelaskan masalah ini, karena untuk masalah besar yang sewenang-wenang sejumlah prosesor paralel tidak ada bedanya.
Tetapi itu ada di sini: sebagaimana disiratkan oleh banyak orang, mata (dan otak) Anda memiliki kapasitas terbatas untuk menyelesaikan masalah ini; dan ini karena seseorang tidak dapat memenuhi sejumlah poin dalam rentang pandangan manusia normal. Mata Anda harus bisa membedakannya untuk permulaan, dan jika ada terlalu banyak, maka mereka akan begitu dekat daripada mata Anda tidak akan melihat perbedaannya. Intinya: itu cepat untuk poin cukup baik yang sesuai dengan pandangan normal Anda, yaitu sangat sedikit. Dalam kasus lain itu akan gagal.
Jadi, Anda dapat menyelesaikan masalah ini di O (1) untuk kasus kecil dan sederhana yang dapat diproses oleh otak Anda dengan mudah. Di luar itu, itu tidak bisa dan karena itu, itu bahkan bukan O ( apa pun ) karena kemungkinan besar gagal.
sumber
Tidak ada yang menyebutkan bahwa masalah ini dapat diselesaikan dengan sangat cepat pada komputer dengan indeks spasial. Ini sama dengan memplot poin dalam gambar agar mata Anda memindai dengan cepat dan menghilangkan sebagian besar poin.
Ada algoritma pengindeksan yang sangat baik yang digunakan oleh Google dan lainnya untuk menemukan titik terdekat yang disebut Geohash. http://en.wikipedia.org/wiki/Geohash .
Saya pikir ini akan meningkatkan kontes yang mendukung komputer. Saya tidak terkesan dengan beberapa jawaban yang menggunakan pemikiran linear.
sumber
Jika kita mempertimbangkan kasus menemukan tetangga terdekat di set titik n-dimensi dalam ruang Euclidean, kompleksitas biasanya dibatasi oleh jumlah dimensi saat ia tumbuh besar (yaitu lebih besar dari ukuran dataset).
Masalah menemukan titik terdekat ke sebuah simpul dalam grafik memiliki ekspresi Euclidean setiap kali grafik dapat tertanam ke dalam ruang Euclidean dengan distorsi yang cukup kecil. Dan menggunakan daftar adjacency dengan bobot, kita masih perlu membangun daftar adjacency.
sumber
jawaban lain baik tetapi bagaimana dengan pertanyaan penghitung zen yang memperluas dasar pemikiran / premis dari pertanyaan asli ke ekstrem untuk menunjukkan beberapa kesalahan [tetapi juga paradoks pada inti penelitian AI ]:
ada beberapa cara untuk menjawab pertanyaan Anda, tetapi pada dasarnya, proses berpikir dan kemampuan persepsi otak kita belum tentu dapat diakses untuk introspeksi, dan introspeksi yang kita lakukan pada mereka bisa menyesatkan. misalnya kita dapat mengenali objek tetapi kita tidak memiliki cara untuk memahami / menjelaskan proses kuasi-algoritmik yang berlangsung untuk memungkinkan ini. juga ada banyak eksperimen psikologi yang menunjukkan ada distorsi halus dalam persepsi kita tentang realitas dan khususnya persepsi waktu, lihat misalnya persepsi waktu .
pada umumnya dianggap / diperkirakan oleh para ilmuwan bahwa otak manusia sebenarnya menggunakan algoritma tetapi fungsinya berbeda dari yang terkomputerisasi, dan juga ada sejumlah besar pemrosesan paralel yang terjadi di otak melalui jaringan saraf yang tidak dapat dibandingkan secara masuk akal dengan algoritma komputer berurutan . pada mamalia, persentase yang signifikan dari seluruh volume otak didedikasikan untuk pemrosesan visual.
dengan kata lain otak manusia dalam banyak hal adalah komputer visual yang sangat dioptimalkan, dan mereka sebenarnya dalam banyak hal memiliki kemampuan yang melebihi superkomputer terhebat dunia saat ini, seperti dalam pengenalan objek dan sebagainya, dan itu disebabkan oleh kekurangan (sebagai perbandingan) dalam perangkat lunak / perangkat keras buatan manusia dibandingkan dengan biologi yang telah sangat disetel / dikembangkan / dioptimalkan selama jutaan tahun.
sumber
Secara umum Anda memecahkan dua masalah yang berbeda dan jika Anda bersaing dalam kompetisi yang sama, kompleksitas akan menjadi O (1) untuk Anda berdua. Mengapa? Mari kita buat situasi sedikit lebih sederhana - asumsikan bahwa Anda memiliki garis dengan satu titik merah dan titik hijau. Tugas Anda adalah menemukan titik hijau yang paling dekat dengan titik merah. Semuanya ada di grafik. Sekarang apa yang Anda lakukan dan apa yang Anda lakukan program pada dasarnya sama - hanya "berjalan pergi" (di kedua arah) dari titik merah dan memeriksa apakah piksel yang Anda lihat adalah putih / hitam (latar belakang) atau hijau. Sekarang kompleksitasnya adalah O (1).
Yang menarik adalah bahwa beberapa metode penyajian data segera memberikan jawaban atas beberapa pertanyaan (O (1)). Contoh dasar sangat sederhana - cukup hitung piksel putih pada gambar hitam (setiap nilai piksel adalah 0 = hitam atau 1 = putih). Yang perlu Anda lakukan hanyalah menambahkan semua nilai piksel - kompleksitasnya sama untuk 1 piksel putih dan 1000, tetapi itu tergantung pada ukuran gambar - O (m), m = image.width * image.height. Apakah mungkin melakukannya lebih cepat? Tentu saja, semua yang perlu kita lakukan adalah menggunakan metode berbeda untuk menyimpan gambar yang merupakan gambar integral : Sekarang menghitung hasilnya adalah O (1) (jika Anda memiliki gambar integral sudah dihitung). Cara lain adalah hanya menyimpan semua piksel putih dalam array / vektor / daftar / ... dan hitung saja ukurannya - O (1).
sumber