Bagaimana cara menangani data Excel secara efisien

1

Saya memiliki data level perusahaan pada berbagai variabel tetapi sejumlah besar data tidak ada. Jadi saya ingin mengurangi ukuran kumpulan data saya dengan menjatuhkan perusahaan yang memiliki jumlah pengamatan yang sangat sedikit. Saya tidak ingin melakukannya secara manual. Apakah ada cara efisien untuk menangani masalah ini di Excel?

Raystafarian
sumber
2
Pertanyaan Anda menentukan Excel. Saya tidak dapat menolak komentar bahwa ini akan menjadi sekitar dua baris kode di Stata, dan saya memiliki harapan bahwa itu akan semudah dalam perangkat lunak statistik lainnya. Dengan kata lain: Excel bukan mesin yang sangat baik untuk manajemen data.

Jawaban:

3

Buat salinan buku kerja Anda sehingga Anda bisa memodifikasinya

  1. Buat lembar baru di buku kerja Anda yang baru.

  2. Dapatkan daftar unik nama perusahaan dan letakkan ini di lembar baru. Anda dapat melakukan ini menggunakan perintah filter tanpa duplikat.

  3. Sekarang, gunakan fungsi countif () untuk menghitung berapa kali setiap perusahaan muncul. Cari tahu apa cut-off Anda akan didasarkan pada ini, yang berarti memutuskan berapa kali perusahaan harus memiliki entri untuk dimasukkan.

  4. Misalkan Anda hanya ingin menjaga perusahaan dengan 10 pengamatan atau lebih. Di lembar asli Anda dengan semua pengamatan, buat variabel baru yang disebut COUNT dalam kolom dan gunakan fungsi VLOOKUP tempat Anda ingin mencari nama perusahaan di lembar baru dan mengimpor hitungan berapa kali perusahaan itu muncul. Ini akan memberi Anda kolom di mana untuk setiap perusahaan Anda memiliki nilai dalam kolom COUNT yang sesuai dengan berapa kali perusahaan itu muncul (nilainya harus sama untuk semua pengamatan perusahaan itu).

  5. Urutkan lembar asli Anda dengan variabel COUNT dalam urutan menurun. Ini berarti perusahaan dengan pengamatan terbanyak akan berada di atas.

  6. Hapus semua perusahaan dengan kurang dari sepuluh pengamatan.

Untuk meringkas: Cari tahu berapa kali setiap perusahaan muncul. Urutkan pengamatan berdasarkan nilai itu. Jatuhkan perusahaan yang memiliki observasi terlalu sedikit.

Saya tidak tahu apakah ini benar-benar pertanyaan statistik seperti halnya pertanyaan Excel.

Kematian14
sumber
0

Saya akan melakukan sesuatu yang mirip dengan jawaban @ Deathkill14, tapi saya akan membangun langkah 1-5 menggunakan Tabel Pivot. Di panel Daftar Bidang PivotTable, saya akan menyeret Nama Perusahaan ke Label Baris dan menyeretnya lagi ke wilayah Nilai untuk mendapatkan Hitung berdasarkan nama.

Lalu saya akan mengklik salah satu sel Nama Perusahaan di Tabel Pivot, dan dari pita Data klik Urutkan, lalu pilih Turun menurut Hitungan Nama Perusahaan.

Jika Anda mencoba mengelola kumpulan data besar di Excel, Anda harus melihat ke Power Pivot alias Model Data Excel. Ini memampatkan data untuk kinerja dan mendukung hubungan tabel dan rumus.

Mike Honey
sumber