在于数据写入的方式和分区的管理方式。
/data/year=2022/month=01/
目录下。这种方式需要开发人员手动管理分区路径,包括创建分区目录、指定分区路径等。partitionBy(year, month)
,系统会根据year和month字段的值自动将数据分区存储。在使用partitionBy的情况下,数据写入时无需手动指定分区路径,系统会根据分区字段的值自动将数据写入到对应的分区目录中。区别:
对于直接写入分区路径和使用partitionBy,选择哪种方式取决于具体的需求和场景。如果分区较少且分区路径固定,可以选择直接写入分区路径;如果分区较多或需要动态管理分区,可以选择使用partitionBy。
领取专属 10元无门槛券
手把手带您无忧上云