如何描述avro模式中的spark StructType
数据类型?我正在生成一个拼图文件,其格式在avro模式中描述。然后将该文件从S3加载到spark中。存在array
和map
数据类型,但这些数据类型与StructType
不对应。
发布于 2020-04-08 21:15:21
使用org.apache.spark.sql.avro包(Spark2.4),您可以将sparkSQL模式转换为avro模式,反之亦然。
你不能这样尝试:
import org.apache.spark.sql.avro.SchemaConverters val sqlType = SchemaConverters.toSqlType(avroSchema) var rowRDD = yourGeneircRecordRDD.map(record => genericRecordToRow(record, sqlType)) val df = sqlContext.createDataFrame(rowRDD , sqlType.dataType.asInstanceOf[StructType])
你也可以在这里找到更多的答案:Code
https://stackoverflow.com/questions/61057961
复制相似问题