Saya membuat Spark 1.4 dari master pengembangan GH, dan pembuatannya berjalan dengan baik. Tetapi ketika saya melakukannya, bin/pyspark
saya mendapatkan versi Python 2.7.9. Bagaimana saya bisa mengubahnya?
python
python-3.x
apache-spark
tchakravarty
sumber
sumber
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
:, dalam hal ini menjalankan notebook IPython 3.Jawaban:
Cukup atur variabel lingkungan:
export PYSPARK_PYTHON=python3
jika Anda ingin ini menjadi perubahan permanen tambahkan baris ini ke skrip pyspark.
sumber
export PYSPARK_PYTHON=python3.5
untuk Python 3.5$SPARK_HOME/conf/spark-env.sh
jadispark-submit
gunakan interpreter yang sama juga.Jika Anda ingin menjalankan di Notebook IPython, tulis:
PYSPARK_PYTHON=python3 PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
Jika
python3
tidak dapat diakses, Anda harus meneruskan jalur ke sana.Ingatlah bahwa dokumentasi saat ini (mulai 1.4.1) memiliki instruksi yang sudah ketinggalan zaman. Untungnya, itu telah ditambal .
sumber
1, edit profil:
vim ~/.profile
2, tambahkan kode ke dalam file:
export PYSPARK_PYTHON=python3
3, jalankan perintah:
source ~/.profile
4,
./bin/pyspark
sumber
Lihat file tersebut. Garis shebang mungkin menunjuk ke biner 'env' yang mencari jalur untuk executable pertama yang kompatibel.
Anda dapat mengubah python menjadi python3. Ubah env untuk langsung menggunakan hardcode biner python3. Atau jalankan biner secara langsung dengan python3 dan hilangkan baris shebang.
sumber
PYSPARK_PYTHON
variabel lingkungan.Untuk Jupyter Notebook, edit
spark-env.sh
file seperti yang ditunjukkan di bawah ini dari baris perintahGoto bagian bawah file dan salin tempel baris ini
export PYSPARK_PYTHON=python3 export PYSPARK_DRIVER_PYTHON=jupyter export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Kemudian, jalankan perintah berikut untuk memulai pyspark di notebook
sumber