1.简介
本篇文章主要讲如何使用java生成Avro格式数据以及如何通过spark将Avro数据文件转换成DataSet和DataFrame进行操作。
1.1Apache Arvo是什么?...Apache Avro 是一个数据序列化系统,Avro提供Java、Python、C、C++、C#等语言API接口,下面我们通过java的一个实例来说明Avro序列化和反序列化数据。...{"name":"ca_street_type","type":"string"}, {"name":"ca_suite_number","type":"string"}, {"name...":"ca_city","type":"string"}, {"name":"ca_county","type":"string"}, {"name":"ca_state","type"...:"string"}, {"name":"ca_zip","type":"string"}, {"name":"ca_country","type":"string"}, {"name