腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(6689)
视频
沙龙
1
回答
检查表
是否
存在
:
Spark
bigquery
连接器
、
我使用
spark
Bigquery
连接器
从
bigquery
读取数据。需要在读取表之前
检查表
是否
存在
。否则,API将抛出错误我们有没有办法在
spark
bigquery
连接器
中处理这个问题。
浏览 7
提问于2019-08-07
得票数 0
2
回答
用星火
BigQuery
连接器
旋转Dataproc集群
、
、
阅读这个repo:下的说明,我按照下面的初始化操作创建一个新的Dataproc集群,并安装了特定版本的Google和
BigQuery
连接器
: gcloud beta dataproc clusters但是,使用PySpark笔记本通过Jupyter仍然会导致
BigQuery
“未找到类”异常。当我直接从终端运行PySpark时,也会发生同样的情况。我能够避免这种异常的唯一方法是在集群的主节点中复制另一个jar (这次是
spark
-
bigquery
_2.11-0.8.1-beta-shaded.jar),然后
浏览 4
提问于2019-10-02
得票数 3
回答已采纳
2
回答
org.apache.
spark
.SparkException:未能初始化类com.google.cloud.
spark
.
bigquery
.SparkBigQueryConnectorUserAgentProvider
、
、
、
、
= SparkSession.builder.appName('Jupyter
BigQuery
Storage').config('
spark
.jars','gs://
spark
-lib/
bigquery
/
spark
-
bigquery
-latest.jar').getOrCreate() table = "project_name.dataset_name.test_table
浏览 15
提问于2020-06-11
得票数 2
回答已采纳
1
回答
如何使用Livy在Dataproc中包含
BigQuery
连接器
、
、
我试图使用驻留在GCP中的Livy运行我的应用程序,但我得到了以下信息:“java.lang.ClassNotFoundException:
bigquery
.DefaultSource引起的”如何将
bigquery
-
连接器
包含在Livy的类路径中?你能帮帮我吗?谢谢大
浏览 0
提问于2021-07-01
得票数 2
回答已采纳
1
回答
Bigquery
作为Dataproc的转移
、
、
、
蜂巢被
BigQuery
所取代。在本例中,使用
连接器
将单元读和写转换为
bigquery
读写。然而,问题在于通过
spark
创建和删除
bigquery
表,因为
spark
将默认在由蜂窝转移支持的蜂巢上运行创建和删除查询,而不是在大型查询上运行。我想检查一下
是否
有计划将DDL语句支持以及星火-
bigquery
-
连接器
的一部分结合在一起。此外,从体系结构的角度看,
是否
有可能将
spark
的转移建立在
big
浏览 7
提问于2022-03-30
得票数 2
回答已采纳
2
回答
如何在本地用java连接到
spark
的Google大查询?
、
、
/GoogleCloudPlatform/
spark
-
bigquery
-connector#compiling-against-the-connector 我的代码: sparkSession.conf:142) at com.google.cloud.<em
浏览 219
提问于2019-12-05
得票数 2
2
回答
ClassNotFoundException:找不到数据源:
bigquery
、
、
、
、
我正在尝试将数据从谷歌
BigQuery
加载到在Google Dataproc上运行的
Spark
(我使用的是Java)。</groupId> <version>0.9.1-beta</然而,Eclipse也警告我“导入的com.google.cloud.
spark
.
bigquer
浏览 24
提问于2019-11-03
得票数 3
回答已采纳
1
回答
将
BigQuery
与
Spark
集成
、
、
我怎样才能将“星火”连接到谷歌的
BigQuery
?但是我发现唯一的JDBC驱动程序是旧的。来自
Spark
"url" -> "jdbc:postgresql:dbserver", "dbtable
浏览 3
提问于2015-10-03
得票数 1
3
回答
以高效的方式从
BigQuery
读取到
Spark
?
、
、
、
当使用从
BigQuery
读取数据时,我发现它首先将所有数据复制到Google Cloud Storage。然后将这些数据并行读取到
Spark
中,但当读取大表时,复制数据阶段需要很长时间。那么有没有更有效的方法将数据从
BigQuery
读取到
Spark
中呢? 另一个问题:从
BigQuery
阅读由2个阶段组成(复制到GCS,从GCS并行阅读)。复制阶段
是否
受
Spark
簇大小的影响,还是需要固定的时间?
浏览 6
提问于2017-01-04
得票数 7
回答已采纳
1
回答
在使用apache大查询
连接器
时获取Py4JJavaError
、
、
、
我正在尝试使用木星笔记本中的Apache存储
连接器
从大型查询表中提取数据。我需要提取这些数据并使用一些分区写入gcs桶中。我在GCP中创建了一个data集群,并在其中运行了木星笔记本。下面是我的代码 在scala版本的基础上,我使用了下面列出的火花-
bigquery
-
连接器
jar的正确版本。Scala版本2.11 - 'gs://
spark
-lib/
bigquery
/
spark
-
bigquery
-latest.jar
浏览 18
提问于2021-12-16
得票数 1
1
回答
Google脚本-
检查表
是否
存在
,如果
存在
则删除它,检查删除作业
是否
完成
、
以下是我想做的事 如果确实
存在
,就删除它。} catch (err){
浏览 0
提问于2018-07-19
得票数 0
回答已采纳
1
回答
Google和
BigQuery
与自定义查询的集成
、
="") GROUP EACH BY prop11我们在hadoop
连接器
中有Java吗?
浏览 0
提问于2016-04-20
得票数 0
回答已采纳
2
回答
火花读取
BigQuery
外部表
、
、
、
、
尝试从
BigQuery
读取外部表,但却遇到错误
SPARK
_VERSION="3.1.2" com.google.cloud.
spark
:
spark
-
bigquery
-with-dependencies_2.12:0.24.2' table = 'da
浏览 29
提问于2022-04-18
得票数 3
回答已采纳
1
回答
Dataproc:使用
BigQuery
读写数据时使用PySpark时的错误
、
、
、
.config('
spark
.jars.packages', 'com.google.cloud.
spark
:
spark
-
bigquery
-with-dependencies:65) at com.google.cloud.
spark
.
bigquery
.repa
浏览 15
提问于2022-08-09
得票数 1
回答已采纳
2
回答
如何将DeltaLake文件从GCS包含到
BigQuery
、
、
、
、
是否
有库/
连接器
可直接将存储在Google (GCS)中的文件导入到
BigQuery
?我已经成功地使用
Spark
作为中介编写了
BigQuery
表,但是我找不到--任何直接
连接器
或
BigQuery
库--如果不通过
spark
进行转换就可以做到这一点。Update 1:我尝试使用正式的
连接器
,但是缺少关于如何指向
BigQuery
中的特定项目的文档,所以我只能将DeltaLake文件从GCS加载到Datafram
浏览 3
提问于2021-10-27
得票数 2
回答已采纳
1
回答
阅读
bigquery
: java.lang.ClassNotFoundException: org.apache.
spark
.internal.Logging$class时出错
、
、
、
、
:
spark
.jars=gs://
spark
-lib/
bigquery
/
spark
-
bigquery
-latest.jarimport argparsegcloud dataproc jobs submit pyspark myscript.py --cl
浏览 1
提问于2020-11-12
得票数 3
回答已采纳
1
回答
使用
Spark
BigQuery
连接器
查询
BigQuery
视图时未启用缓存
、
、
、
、
我正在使用
Spark
BigQuery
连接器
从Dataproc集群中查询表和视图,我看到的是,当请求未使用缓存的视图时,
连接器
会为每个读取的视图创建一个新的临时表:当我从一个表中读取数据时,情况并非如此,这里使
浏览 0
提问于2021-01-13
得票数 2
2
回答
如何使用
spark
bq
连接器
查询INFORMATION_SCHEMA视图?
、
、
但是,当我从
spark
-bq
连接器
使用相同的查询时,它失败了。
spark
.read.format("
bigquery
").load("PROJECT-ID.DATASET.INFORMATION_SCHEMA.PARTITIONS") 错误: "Invalid project从
spark
-bq
连接器
查询INFORMATION_SCHEMA的正确方式是什么?
浏览 44
提问于2021-07-20
得票数 1
2
回答
Dataproc notebook无法导入或导出到
BigQuery
:未找到类异常
、
、
这是我正在进行的
spark
会话。我包含了最新的用于
spark
big query connector for Dataproc 1.5的jar。from pyspark.sql import SparkSession
spark
= SparkSession.builder.appName("GCS to
BigQuery
- Dev") \.config('
spark
.jars', 'gs://
spark
-lib
浏览 8
提问于2021-02-11
得票数 2
回答已采纳
1
回答
如何将PySpark连接到
Bigquery
、
、
我正在尝试使用PySpark读取表格形式的
BigQuery
。我尝试过以下几种方法 table = 'my-project-id.project-dataset.test_table_
spark
' df =
spark
.read.format('
bigquery
'('table', table).load() 然而,我得到了这个错误 : java.lang.ClassNotFoundException: Failed to find data source: <em
浏览 19
提问于2019-10-01
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券