Eu criei o Spark 1.4 a partir do mestre de desenvolvimento GH e a compilação foi bem. Mas quando faço um bin/pyspark
, recebo a versão Python 2.7.9. Como posso mudar isso?
python
python-3.x
apache-spark
tchakravarty
fonte
fonte
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
caso, ele executa o notebook IPython 3.Respostas:
Basta definir a variável de ambiente:
export PYSPARK_PYTHON=python3
caso você queira que esta seja uma mudança permanente, adicione esta linha ao script pyspark.
fonte
export PYSPARK_PYTHON=python3.5
para Python 3.5$SPARK_HOME/conf/spark-env.sh
assimspark-submit
usa o mesmo intérprete também.Se você deseja executar no Notebook IPython, escreva:
Se
python3
não estiver acessível, você precisa passar o caminho para ele.Lembre-se que a documentação atual (a partir de 1.4.1) possui instruções desatualizadas. Felizmente, ele foi corrigido .
fonte
1, editar perfil:
vim ~/.profile
2, adicione o código ao arquivo:
export PYSPARK_PYTHON=python3
3, execute o comando:
source ~/.profile
4,
./bin/pyspark
fonte
Dê uma olhada no arquivo. A linha shebang é provavelmente apontada para o binário 'env' que procura o caminho para o primeiro executável compatível.
Você pode alterar python para python3. Altere o env para usar diretamente o binário python3 codificado. Ou execute o binário diretamente com python3 e omita a linha shebang.
fonte
PYSPARK_PYTHON
variável de ambiente.Para Jupyter Notebook, edite o
spark-env.sh
arquivo conforme mostrado abaixo na linha de comandoVá para o final do arquivo e copie e cole estas linhas
Em seguida, basta executar o seguinte comando para iniciar o pyspark no notebook
fonte