“Escreva Dataframe de dados Pyspark para CSV” Respostas de código

Escreva Dataframe de dados Pyspark para CSV

# In this example, change the field column_as_array to column_as_string before saving.

from pyspark.sql.functions import udf
from pyspark.sql.types import StringType

def array_to_string(my_list):
    return '[' + ','.join([str(elem) for elem in my_list]) + ']'

array_to_string_udf = udf(array_to_string, StringType())

df = df.withColumn('column_as_str', array_to_string_udf(df["column_as_array"]))

# Then you can drop the old column (array type) before saving.
df.drop("column_as_array").write.csv(...)
Scarlet Macaw

pyspark dataframe para csv único

df.repartition(1).write.csv('/path/csvname.csv')
Vinicius VALE

Salve o DataFrame em um arquivo local CSV Pyspark

df.repartition(1).write.format('com.databricks.spark.csv').save("/path/to/file/myfile.csv",header = 'true')
Grotesque Gaur

Respostas semelhantes a “Escreva Dataframe de dados Pyspark para CSV”

Perguntas semelhantes a “Escreva Dataframe de dados Pyspark para CSV”

Mais respostas relacionadas para “Escreva Dataframe de dados Pyspark para CSV” em Python

Procure respostas de código populares por idioma

Procurar outros idiomas de código