Pertanyaan yang diberi tag parsing

Menganalisis (tidak) data terstruktur untuk mengubahnya menjadi format terstruktur dan dinormalisasi.

38
Mengapa parsing ketat tidak dipilih untuk HTML?

Saya sering bertanya-tanya mengapa parsing ketat tidak dipilih saat membuat HTML. Untuk sebagian besar riwayat Internet, browser telah menerima segala jenis markup dan mencoba yang terbaik untuk menguraikannya. Proses ini menurunkan kinerja, memungkinkan orang untuk menulis omong kosong, dan...

37
C ++ 11 termasuk std :: stoi, mengapa tidak std :: itos?

Saya memperhatikan kegembiraan saya bahwa C ++ 11 memiliki std::sto@keluarga fungsi untuk dengan mudah membongkar int / mengapung / rindu apa pun dari string. Namun saya terkejut, yang terjadi malah sebaliknya. Mengapa komite standar tidak menyertakan std::itoskeluarga fungsi untuk beralih dari int...

31
Bagaimana biasanya komentar diurai?

Bagaimana komentar umumnya diperlakukan dalam bahasa pemrograman dan markup? Saya menulis parser untuk beberapa bahasa markup kustom dan ingin mengikuti prinsip paling tidak mengejutkan , jadi saya mencoba menentukan konvensi umum. Misalnya, haruskah komentar yang tertanam di dalam token...

29
The Inglish parser (untuk The Hobbit 1982)

Terpesona membaca tentang game petualangan teks The Hobbit yang menampilkan parser yang sangat tangguh bernama "Inglish": ... Inglish mengizinkan seseorang mengetik kalimat tingkat lanjut seperti "tanya Gandalf tentang peta yang ingin tahu lalu bawa pedang dan bunuh troll dengannya". Pengurai...

27
Nama untuk jenis parser ini, ATAU mengapa tidak ada

Pengurai konvensional mengkonsumsi seluruh input mereka dan menghasilkan pohon pengurai tunggal. Saya mencari yang mengkonsumsi aliran kontinu dan menghasilkan hutan parse [ edit: lihat diskusi dalam komentar mengenai mengapa penggunaan istilah itu mungkin tidak konvensional ]. Perasaan saya...

24
Apa argumen yang menentang parsing cara Cthulhu?

Saya telah diberi tugas untuk mengimplementasikan Bahasa Spesifik Domain untuk alat yang mungkin menjadi sangat penting bagi perusahaan. Bahasa ini sederhana tetapi tidak sepele, itu sudah memungkinkan loop bersarang, penggabungan string, dll. Dan secara praktis yakin bahwa konstruksi lain akan...

19
Bisakah format csv ditentukan oleh regex?

Seorang kolega dan saya baru-baru ini berdebat tentang apakah sebuah regex murni mampu sepenuhnya meng-enkapsulasi format csv, sedemikian rupa sehingga ia mampu mengurai semua file dengan char escape, quote char, dan char separator yang diberikan. Regex tidak harus mampu mengubah karakter ini...

14
unit test untuk parser csv

Tes apa yang harus saya gunakan untuk menguji parser csv? Saya memiliki parser csv sederhana di C #, dan saya ingin memastikan bahwa saya memiliki cakupan tes unit yang baik dari semua kasus tepi umum (dan tidak umum). Tes apa yang harus saya gunakan untuk mengidentifikasi masalah potensial dan...