Nama: pertama, mungkin tengah, dan nama keluarga.
Saya ingin tahu tentang seberapa banyak informasi yang dapat Anda gali dari suatu nama, menggunakan kumpulan data yang tersedia untuk umum. Saya tahu bahwa Anda bisa mendapatkan yang berikut dengan di mana saja antara probabilitas rendah-tinggi (tergantung pada input) menggunakan data sensus AS: 1) Jenis Kelamin. 2) Perlombaan.
Facebook misalnya, menggunakan persis itu untuk mencari tahu, dengan tingkat akurasi yang layak, distribusi rasial dari pengguna situs mereka (https://www.facebook.com/note.php?note_id=205925658858).
Apa lagi yang bisa ditambang? Saya tidak mencari sesuatu yang spesifik, ini adalah pertanyaan yang sangat terbuka untuk mengurangi rasa penasaran saya.
Contoh saya khusus untuk AS, jadi kami akan menganggap bahwa nama itu adalah nama seseorang yang berlokasi di AS; tetapi, jika seseorang mengetahui set data yang tersedia untuk umum untuk negara lain, saya lebih dari terbuka untuk mereka juga.
Saya tidak yakin apakah ini tempat yang tepat untuk ini, jika tidak, saya akan menghargai jika seseorang dapat mengarahkan saya ke tempat yang lebih tepat.
Saya harap ini pertanyaan yang menarik, dan ini adalah tempat yang tepat!
Jawaban:
Ini bukan jawaban yang serius, tetapi saya baru ingat sesuatu dari buku yang saya baca setahun yang lalu. Ada bab dalam Freakonomics yang ditujukan untuk apa yang dapat Anda ceritakan tentang seseorang dari namanya. Bab ini didasarkan pada makalah penelitian penulis Penyebab dan konsekuensi dari nama hitam yang khas
Saya pikir saya telah menemukan kutipan atau ringkasannya di artikel ini
sumber
Dari nama depan, prediksi wilayah, usia, status imigran generasi pertama. Dari nama belakang Anda dapat memprediksi lokasi geografis dari patronim asli. Untuk nama lengkap, Anda dapat memprediksi status sosial dan ekonomi (Thurston Howell III).
sumber
Untuk menambahkan saran lain di sini, salah satu sumber terbesar untuk data keluarga adalah rakit situs silsilah di luar sana. Saya pikir sebagian besar orang barat mungkin terdaftar oleh beberapa anggota keluarga, jauh atau sebaliknya pada beberapa dari mereka dan inklusi semacam itu dilengkapi dengan silsilah keluarga yang biasanya lengkap, lengkap dengan tempat, perincian kelahiran, dll. Sangat informatif.
Jika Anda mencocokkan data itu dengan grafik teman di Facebook, karena orang cenderung menambahkan saudara kandung / sepupu (dan kadang-kadang orang tua / anak-anak), maka gunakan data lokasi dengan peran pemilihan dan direktori, Anda biasanya dapat menentukan orang-orang bahkan dengan nama umum, dan dapatkan data dalam jumlah besar yang mengejutkan.
sumber
Bab terakhir Freakonomics (2005, Steven D. Levitt dan Stephen J. Dubner) memiliki diskusi yang menarik tentang nama-nama, terutama yang berkaitan dengan status dan ras sosial-ekonomi.
Mereka memiliki daftar nama depan yang mungkin berkorelasi dengan analisis nama belakang FB. Mereka juga menggambarkan bagaimana pilihan nama berubah secara diakronis (lintas waktu).
Siapa tahu - nama pilihan orang tua mungkin lebih akurat daripada yang dilaporkan orang tentang sensus.
sumber
Anda punya banyak saran bagus di atas, jadi saya hanya akan menyebutkan anekdot yang menarik. Seorang siswa musim panas (sekarang seorang ilmuwan komputer terkemuka) di sebuah lab riset perusahaan (yang akan tetap tanpa nama) melihat data dari direktori telepon online perusahaan, dan membangun model prediksi untuk tingkat pembayaran menggunakan karakter n-gram dari nama. Prediktor terkuat adalah bahwa ez_ menunjukkan tingkat upah yang lebih rendah, sebuah penemuan yang saya bayangkan ia tidak terdorong untuk berbicara tentang ...
sumber
Anda mungkin bisa mengetahuinya:
Btw yang berarti Anda tidak boleh menggunakan apa pun dari daftar di atas untuk kata sandi, pertanyaan rahasia, dll.
sumber
Darden dan Robinson (1976) berusaha menemukan struktur linguistik yang memandu asosiasi orang tentang nama depan pria. Mereka meminta dua kelompok subjek (siswa sosiologi dan perwira angkatan laut) untuk menilai satu set nama-nama Amerika yang umum di sepanjang perbedaan semantik seperti soft-tough, common-noble, dan urban-rural. Mereka juga meminta penilaian kesamaan antara pasangan nama yang berbeda, dan dengan cara validasi mereka menghubungkan cara dari perbedaan semantik dengan dimensi yang mereka temukan, baik dalam tiga dan empat solusi D, menggunakan prosedur TORSCA MDS.
Para penulis menemukan solusi 3-D mereka secara kasar sesuai dengan trio klasik Osgood tentang aktivasi, evaluasi dan potensi. Dalam empat dimensi, ruang cocok dengan data sedikit lebih baik, dan di sini mereka menafsirkan struktur sebagai tergantung pada "karakter," "kematangan," "kemasyarakatan," dan "kejantanan," meskipun skala ini tampaknya tidak didefinisikan dengan baik seperti saran penulis. Satu temuan mengejutkan yang datang dari penelitian ini adalah, setidaknya untuk dua sampel kecil ini (n = 83 dan 21), tidak ada dimensi yang sesuai dengan perbedaan antara nama yang diberikan dan nama panggilan.
Darden, DK, dan Robinson, IE (1976). Penskalaan multidimensi nama depan pria: Pendekatan sosiolinguistik. Sosiometri, 39 , 4, 422-431.
sumber
Jumlah informasi yang dapat ditemukan sangat bervariasi, mulai dari ras dan jenis kelamin, hingga semua jenis informasi pribadi. Taruhan terbaik Anda untuk mendapatkan informasi adalah situs jejaring sosial seperti facebook, karena mereka umumnya memberikan lebih banyak informasi daripada database cencus.
sumber
Ada cukup banyak informasi yang bisa Anda dapatkan tergantung pada sumber yang Anda gunakan. Data sensus jelas. Anda juga dapat memperoleh informasi dari Facebook, MySpace, dan situs jejaring sosial lainnya. Anda juga dapat mencari arsip berita publik untuk menyebutkan nama mereka. Mungkin bahkan situs properti ubclained yang dimiliki beberapa negara bagian.
Jika Anda menginginkan contoh dunia nyata dari apa yang dapat dilakukan, lihat pipl.com
sumber
Anda dapat mencari gelar, SIM, catatan polisi (apakah ini terjemahan yang tepat?). Dengan facebook Anda dapat menemukan informasi tentang hobi, olahraga, musik yang disukai. Anda juga dapat mencari proporsi pengguna media sosial lainnya dengan nama yang diberikan. (Saya akan tertarik dengan hasil ini)
sumber
Jangan lupa skor Scrabble, misalnya fungsi skor scrabble Wolfram Alpha
sumber
Jika Anda mengetahui sesuatu tentang lokasi individu, satu sumber informasi adalah basis data pendaftaran pemilih. Banyak basis data pendaftaran pemilih tersedia (dengan biaya; ada perusahaan yang membelinya dan menyediakan akses permintaan online kepada mereka, dengan biaya). Basis data pendaftaran pemilih mungkin memiliki alamat dan / atau tanggal lahir individu. Informasi itu mungkin memungkinkan Anda untuk mencari individu di database lain.
Namun, ada batasan seberapa banyak ini membantu. Ini mungkin bermanfaat jika Anda mengetahui kota atau kabupaten tempat tinggal orang itu, dan jika nama mereka tidak biasa. Tetapi jika ini adalah nama umum, atau jika Anda tidak tahu di mana mereka tinggal, itu mungkin tidak akan membantu Anda.
sumber
salah satu sumber terbesar untuk data yang dapat diakses publik termasuk banyak atribut bermanfaat lainnya adalah kantor panitera daerah untuk catatan kepemilikan properti. issu berkaitan dengan menarik semua data bersama-sama ... beberapa negara menyediakan database pusat tetapi yang lain tidak.
sumber
Kehadiran inisial tengah sudah cukup menarik, dan mungkin memberi tahu kita sesuatu tentang etnis. http://blog.scraperwiki.com/2012/06/15/middle-names-in-the-united-states-over-time/
sumber