Apakah menggunakan SUM () dua kali suboptimal?

Saya tahu saya harus menulis SUMdua kali, jika saya ingin menggunakannya dalam HAVINGklausa (atau menggunakan tabel turunan):

SELECT  id,
  sum(hours) AS totalhours
  FROM mytable
  GROUP BY id
  HAVING sum(hours) > 50;

Pertanyaan saya sekarang adalah, apakah ini suboptimal atau tidak. Sebagai seorang programmer, permintaan ini sepertinya DB akan menghitung jumlah dua kali. Begitukah, atau haruskah saya mengandalkan optimisasi yang akan dilakukan mesin DB untuk saya?

Pembaruan: penjelasan tentang kueri yang sebanding:

postgres=> explain select sum(counttodo) from orderline group by orderlineid having sum(counttodo) > 100;
                             QUERY PLAN                             
--------------------------------------------------------------------
 HashAggregate  (cost=1.31..1.54 rows=18 width=8)
   Filter: (sum(counttodo) > 100)
   ->  Seq Scan on orderline  (cost=0.00..1.18 rows=18 width=8)
(3 rows)

postgresql best-practices aggregate alias Bart Friederichs
sumber

dapatkah Anda memposting penjelasannya?

Ste

Saya tidak akan menjawab ini karena ada penjelasan yang bagus dan singkat di sini : "Jika Anda bertanya-tanya mengapa Anda tidak dapat merujuk ke alias SELECT nanti dalam kueri, seperti dalam klausa WHERE, itu semua berkaitan dengan pesanan evaluasi. SQL tidak dievaluasi dalam urutan yang ditulisnya. SELECT-list sebenarnya dievaluasi hampir terakhir, dan isinya secara efektif belum ada ketika HAVING dll diproses. Ini menjadi penting ketika daftar-pilih menyertakan fungsi dengan efek samping [...] "

dezso

... ini sebabnya Anda tidak bisa hanya merujuk kolom agregat dalam HAVINGklausa - tetapi, menurut pemahaman saya, secara internal ini agak dilakukan sebaliknya.

dezso

@ BartFriederichs, banyak orang mengeluh di samping kalimat-kalimat ini (saya telah mengeluh juga sampai saya tidak terbiasa ...) Itu tidak dieksekusi dua kali dan mungkin dapat dilakukan dengan menggunakan alias di HAVING(dan kemudian menarik definisi kolom dari SELECTklausa) - untuk beberapa alasan mereka tidak melakukannya.

dezso

Saya berpikir bahwa membiarkan mesin DB khawatir tentang optimisasi harus menjadi kebiasaan kedua bagi seorang praktisi RDBMS. SQL adalah 4GL, jadi kita mendefinisikan set hasil yang kita inginkan, bukan cara yang digunakan untuk mencapai. Ada banyak masalah lain di luar sana yang sebagian besar tidak kami khawatirkan - gabung pesanan, atau transformasi EXISTS menjadi gabung misalnya. Masalah khusus ini lebih merupakan masalah dari perspektif "Jangan Ulangi Diri Sendiri" untuk ekspresi yang kompleks, tetapi solusi yang masuk akal (pandangan in-line, CTE) dapat membantu dengan itu.

David Aldridge

Apakah menggunakan SUM () dua kali suboptimal?

Jawaban: