Saya mencoba df.orderBy("col1").show(10)
tetapi diurutkan dalam urutan menaik. df.sort("col1").show(10)
juga memilah dalam urutan menurun. Saya melihat stackoverflow dan jawaban yang saya temukan sudah ketinggalan jaman atau disebut RDD . Saya ingin menggunakan bingkai data asli di percikan.
137
Jawaban:
Anda juga bisa mengurutkan kolom dengan mengimpor fungsi sql spark
Atau
mengimpor sqlContext.implicits._
Atau
sumber
asc
kata kunci tidak diperlukan:..orderBy("col1", "col2")
.Ada dalam
org.apache.spark.sql.DataFrame
untuksort
metode:Catatan
$
dan.desc
disort
dalam kolom untuk mengurutkan hasil.sumber
import org.apache.spark.sql.functions._
danimport sqlContext.implicits._
juga memberi Anda banyak fungsi yang bagus.df.sort($"Time1", $"Time2".desc) SyntaxError: invalid syntax
pada simbol $Hanya PySpark
Saya menemukan posting ini ketika ingin melakukan hal yang sama di PySpark. Cara termudah adalah dengan menambahkan parameter ascending = False:
Referensi: http://spark.apache.org/docs/2.1.0/api/python/pyspark.sql.html#pyspark.sql.DataFrame.orderBy
sumber
sumber
sumber
Dalam kasus Jawa:
Jika kami menggunakan
DataFrames
, saat menerapkan gabungan (di sini Gabungan dalam), kami dapat mengurutkan (dalam ASC) setelah memilih elemen berbeda di setiap DF sebagai:di mana
e_id
kolom tempat bergabung diterapkan sambil diurutkan berdasarkan gaji di ASC.Kita juga dapat menggunakan Spark SQL sebagai:
dimana
sumber