这篇文章主要介绍Spark如何动态定义schema,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
动态定义schema
在需要根据不同数据定义不同schema
val schemaInfo = "name age"
val fields = schemaInfo.map(item=> item.split(" ")
.map(item=>StructField(item,StringType,nullable=true))
val schema = StructType(fields)
val rowRDD = peopleRDD.map(_.split(" ").map(attributes=>Row(attributes(0),attributes(1))
val peopleDF = spark.createDataFrame(rowRDD,schema)
peopleDF.show()
以上是“Spark如何动态定义schema”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网行业资讯频道!