apache hudi - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

将Apache Hudi数据集写入腾讯云cos可以实现嘛，有没有例子？

、、、

将Apache Hudi数据集写入腾讯云cos可以实现嘛，有没有例子？

浏览 231提问于2023-10-10

1回答

运行Apache Hudi deltastreamer时出错

、、、

key=HUDI 但是当我运行下面的spark提交时，错误出现了： Exception in thread "main" org.apache.hudi.com.beust.jcommander.ParameterException:752) at org.apache.hudi.com.beust.jcommander.JCommander.parse(JCommander.java:340)at org.apache.hudi</

浏览 114提问于2020-01-31得票数 2

1回答

java.lang.ClassNotFoundException:未能找到数据源: hudi。请在http://spark.apache.org/third-party-projects.html找到包裹

、、

我正在尝试从hudi读取数据，但得到的数据低于错误。Caused by: java.lang.ClassNotFoundException: Failed to find data source: hudi.Please find packages at http://spark.apache.org/third-party-projects.html import org.apache</em

浏览 20提问于2022-06-13得票数 4

1回答

Dataproc上的Apache Hudi

、、、

' --conf 'spark.sql.extensions=org.apache.spark.sql.hudi.HoodieSparkSessionExtension'警告org.apache.spark.sql.hudi.HoodieSparkSessionExtensionorg.apache.spark.sql.hudi.HoodieSparkSessionExtension._jvm.org.apache.hu

浏览 30提问于2022-12-01得票数 2

回答已采纳

1回答

如何通过Hudi* CLI更改Hudi表版本*

如何通过Hudi更改表版本？ at org.apache.hudi.common.table.HoodieTableVersion.

浏览 32提问于2022-03-02得票数 0

2回答

无法创建配置单元连接jdbc:hive2://localhost:10000。spark-在集群模式下提交

、、、、

我在Apache Spark上运行Apache Hudi应用程序。. at org.<

浏览 87提问于2021-02-16得票数 1

回答已采纳

3回答

Databricks - java.lang.NoClassDefFoundError: org/json/JSONException

、、、

(Driver.java:1049) at org.apache.hudi.hive.HoodieHiveClient.updateHiveSQLUsingHiveDriver(HoodieHiveClient.java:367) at org.apache.hudi.hive.HoodieHiveC

浏览 2提问于2020-11-03得票数 0

回答已采纳

1回答

通过apache* livy执行hudi delta streamer作业*

、、

spark-submit --packages org.apache.hudi:hudi-utilities-bundle_2.11:0.5.3,org.apache.spark:spark-avro_cluster \ --driver-class-path $HADOOP_CONF_DIR \ --class org.apache.hudi.utilities.deltastreamer.Hoo

浏览 29提问于2021-10-07得票数 0

1回答

最后/最后一次提交:使用pyspark获得hudi的最新提交

、、、、

我每小时都使用spark hudi进行增量查询，每次都将增量查询的开始和结束时间保存在db(例如mysql)中。增量查询应该如下所示： 'hoodie.datasource.query.type': 'incremental',': hudi_end_commit但我不知道如何在pyspark(python)中找到hudi_end_commit。spark_session.read.forma

浏览 7提问于2022-05-16得票数 1

1回答

Hudi分区和upsert不工作

、

这个配置中的错误是什么，分区键在HUDI中不起作用，并且在执行upsert时，hudi数据集中的所有记录都会更新。所以不能从表中提取增量。commonConfig = {'className' : 'org.apache.hudi','hoodie.datasource.write.precombine.fieldhoodie.data

浏览 50提问于2021-08-29得票数 1

1回答

在Apache表中编写火花DataFrame

、、

spark-shell \ import org.apache.spark.sql.SaveModeimport org.apache.sp

浏览 1提问于2021-03-19得票数 2

回答已采纳

1回答

Apache Hudi deltastreamer在线程" main“org.apache.hudi.com.beust.jcommander.ParameterException‘中抛出异常没有定义主参数

、、

版本Apache Hudi 0.6.1，Spark 2.4.6 下面是Hudi deltastreamer的标准spark-submit命令，因为没有定义主参数，所以抛出了这个命令。[hadoop@ip-00-00-00-00 target]$ spark-submit --class org.apache.hudi.utilities.deltastreamer.HoodieDeltaStreamer:752) at org.apache.hudi

浏览 113提问于2020-09-08得票数 0

1回答

AWS Glue-如何在s3存储桶中仅输出一个最新文件

、、、

我使用AWS Glue和Apache Hudi将RDS中的数据复制到S3。如果我执行以下任务，将在S3存储桶(basePath)中生成2个拼图文件(初始文件和更新文件)。_jvm.org.apache.hudi.QuickstartUtils.DataGenerator()df = spark

浏览 27提问于2021-11-30得票数 0

1回答

Hudi支持‘update’操作？

我有一个异常，当更新记录与火花sql为hudi如下。:503) at org.apache.hudi.avro.HoodieAvroUtils.getNestedFieldVal(HoodieAvroUtils.java:503) at org.apache.hudi.HoodieSparkSqlWriter: hudi -scamk3.2-b

浏览 10提问于2022-10-17得票数 0

1回答

导入火花放电中的Hudi模块

、、

如何在火花放电中导入hudi模块？%spark.pyspark import org.apache.hudi.DataSourceReadOptionsimport org.apache.hudi.config.HoodieWriteConfig 错误: ModuleNotFoundError:没有名为'org‘的模块

浏览 3提问于2021-10-12得票数 1

1回答

在读取orc文件时，最新版本的Hudi* (0.7.0，0.6.0)是否可以与Spark 2.3.0一起使用？*

、、

("org.apache.hudi")java.lang.NoSuchMethodError: org.apache.spark.sql.types.Decimal$.minBytesForPrecision()[I at org.

浏览 54提问于2021-02-22得票数 0

1回答

Park2.3.0火花壳抛出错误的Apache示例

、、、、

spark-shell \ at org.apache.hudi.spark.org.apache</e

浏览 0提问于2020-12-27得票数 0

回答已采纳

1回答

在Python/Pyspark中使用Apache Hudi

、

有人在Pyspark环境中使用过Apache Hudi吗？如果可能的话，有没有可用的代码样本？

浏览 2提问于2020-03-30得票数 0

1回答

Hudi:在嵌入式模式下访问时间服务器超时

、、

Server=xxx:59520

浏览 279提问于2020-12-22得票数 0

2回答

使用Hudi时，无法在电子病历中的AWS Glue上运行spark.sql

、、、

我们开始使用Apache Hudi，我们可以在de AWS documentation之后让它工作。问题是，当使用文档中指出的配置和JAR时，我们无法在Glue元存储上运行spark.sql。我们使用boto3创建群集 emr.run_job_flow( LogUri='s3n://mybucket/elasticmapreduce" \ --conf "spark.sql.hive.convertM

浏览 101提问于2021-04-10得票数 0

回答已采纳

点击加载更多

将Apache Hudi数据集写入腾讯云cos可以实现嘛，有没有例子？

运行Apache Hudi deltastreamer时出错

java.lang.ClassNotFoundException:未能找到数据源: hudi。请在http://spark.apache.org/third-party-projects.html找到包裹

Dataproc上的Apache Hudi

如何通过Hudi* CLI更改Hudi表版本*

无法创建配置单元连接jdbc:hive2://localhost:10000。spark-在集群模式下提交

Databricks - java.lang.NoClassDefFoundError: org/json/JSONException

通过apache* livy执行hudi delta streamer作业*

最后/最后一次提交:使用pyspark获得hudi的最新提交

Hudi分区和upsert不工作

在Apache表中编写火花DataFrame

Apache Hudi deltastreamer在线程" main“org.apache.hudi.com.beust.jcommander.ParameterException‘中抛出异常没有定义主参数

AWS Glue-如何在s3存储桶中仅输出一个最新文件

Hudi支持‘update’操作？

导入火花放电中的Hudi模块

在读取orc文件时，最新版本的Hudi* (0.7.0，0.6.0)是否可以与Spark 2.3.0一起使用？*

Park2.3.0火花壳抛出错误的Apache示例

在Python/Pyspark中使用Apache Hudi

Hudi:在嵌入式模式下访问时间服务器超时

使用Hudi时，无法在电子病历中的AWS Glue上运行spark.sql

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐