Saya telah bekerja mengembangkan sistem "Konversi Bahasa Alami ke SQL Query".
Saya telah membaca jawaban dari pertanyaan serupa, tetapi tidak dapat memperoleh informasi yang saya cari.
Di bawah ini adalah diagram alur untuk sistem seperti yang saya dapatkan dari Algoritma untuk Mengubah Bahasa Alam menjadi SQL Query untuk Database Relasional oleh Garima Singh, Arun Solanki
Saya sudah mengerti sampai bagian dari langkah pemberian tag ucapan. Tetapi bagaimana saya mendekati langkah-langkah yang tersisa.
- Apakah saya perlu melatih semua pertanyaan SQL yang mungkin?
- Atau, begitu bagian dari penandaan ucapan selesai, saya harus bermain dengan kata-kata dan membentuk query SQL?
Sunting: Saya telah berhasil mengimplementasikan dari langkah "permintaan pengguna" ke "Bagian dari pemberian tag ucapan".
Terima kasih.
Jawaban:
Jika Anda ingin mengatasi masalah dari perspektif lain, dengan ujung ke ujung pembelajaran , sehingga Anda tidak menentukan sebelumnya pipa besar ini yang telah Anda sebutkan sebelumnya, yang Anda pedulikan hanyalah pemetaan antara kalimat dan SQL yang terkait. pertanyaan.
Tutorial:
Bagaimana cara berbicara ke basis data Anda
Dokumen:
Seq2SQL: Menghasilkan Pertanyaan Terstruktur dari Bahasa Alami menggunakan tenaga penjual Learning Reinforcement
Neural Enquirer: Belajar Query Tables dalam Bahasa Alam
Himpunan data:
Korpus parsing semantik beranotasi besar untuk mengembangkan antarmuka bahasa alami.
Kode github:
Juga, ada solusi komersial seperti nlsql
sumber
NLTK memiliki panduan langkah demi langkah yang sangat baik tentang semua yang Anda butuhkan untuk mengubah bahasa manusia menjadi query SQL menggunakan paket nltk dengan python.
Ini belum sempurna, tetapi menjawab pertanyaan Anda.
sumber
Untuk melengkapi jawaban Fadi, berikut ini adalah makalah lain yang bermanfaat tentang metode NL to SQL. Perbedaan utama dari metode ini adalah bahwa mereka mendukung kueri yang harus dijawab menggunakan lebih dari satu tabel (bergabung dengan tabel yang berbeda), namun makalah Salesforce (dan dataset mereka) difokuskan pada kueri pada satu tabel pada suatu waktu.
Kedua makalah ini menggunakan avaialbe dataset GeoQuery di sini .
sumber