腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
Spark.sql
:
删除
列
名称
上
的
表
名
、
、
、
当我查询我
的
数据库时:
spark.sql
("SELECT * FROM MyBase") 我有“MyBase”这个词在我所有栏目的名字前面。 我们能简单地避免这种情况吗?如果没有,
删除
它
的
最好方法是什么?示例: df =
spark.sql
("SELECT name, price FROM MyBase")| mybase.name-+ | Jean |
浏览 49
提问于2020-08-06
得票数 0
回答已采纳
3
回答
如何从Databricks Delta
表
中
删除
列
?
、
、
、
、
我最近开始发现Databricks,并面临需要
删除
增量表
的
某一
列
的
情况。当我使用PostgreSQL时,它就像DROP COLUMN metric_1; 我正在查看
删除
时
的
数据库,但它只覆盖了DELETE the我也找到了关于DROP database,DROP function和DROP table
的
文档,但完全没有关于如何从增量表中
删除
列
的
文档。这
浏览 4
提问于2019-01-31
得票数 12
回答已采纳
1
回答
使用pyspark从dataframe中添加temp
表
中
的
多个
列
、
、
、
试图在Databricks中
的
Pyspark中创建一个
表
,该
表
将捕获每个
表
的
数据库
名称
、
表
名
和DDL语句。蜂窝亚稳态已经加载在AzureMySQL中,而Databricks集群正是在其上进行指向
的
。虽然在单独
的
dataframe对象中,我能够捕获所需
的
详细信息,但是无法将它们合并到一个
表
中。我正在查看
的
模式: DatabaseName、TableName、Crea
浏览 6
提问于2022-10-11
得票数 0
回答已采纳
3
回答
如何避免join中
的
键列
名称
重复?
、
我正在尝试在spark sql中连接两个
表
。每个
表
都有50+
列
。两者都将
列
id作为关键字。
spark.sql
("select * from tbl1 join tbl2 on tbl1.id = tbl2.id") 联接
的
表
具有重复
的
id
列
。当然,我们可以像下面这样指定要保留
的
id
列
:
spark.sql
("select tbl1.id, .....f
浏览 79
提问于2021-08-08
得票数 2
6
回答
将火花数据作为动态分区
表
保存在蜂巢中
、
、
、
可以使用df.saveAsTable(tablename,mode)方法以拼花格式将数据存储到Hive
表
中。上面的代码工作正常,但是我每天都有这么多
的
数据,所以我想根据creationdate(
表
中
的
列
)动态地划分hive
表
。任何帮助都是非常感谢
的
。
浏览 7
提问于2015-07-10
得票数 41
回答已采纳
1
回答
spark sql支持嵌套查询吗?
、
、
、
我做了一张桌子
spark.sql
("""...temp)""")org
浏览 76
提问于2021-05-12
得票数 0
4
回答
如何在数据库中显示所有数据库中
的
所有
表
、
以下内容可分别用于在当前架构或指定架构中显示
表
:这里记录了这个文档: 是否有方法显示所有数据库中
的
所有
表
?数据库中是否有元数据
表
(类似于甲骨文中
的
all_或dba_
表
或MySql中
的
information_schema
表
)?是否有一种方法可以对Databricks中
的
数据库对象执行更具体
的
查询?
浏览 10
提问于2020-08-30
得票数 2
回答已采纳
2
回答
从星火看saveAsTable
、
、
我们试图从SPARK中写入一个蜂箱
表
,并且使用saveAsTable函数。我想知道saveAsTable是否每次掉落并重新创建蜂巢
表
?如果它这样做了,那么是否还有其他可能
的
火花函数实际
上
只会截断和加载一个
表
,而不是拖放和重新创建。
浏览 0
提问于2018-07-17
得票数 2
回答已采纳
1
回答
如何移动数据库和重新创建
表
以尽量减少停机时间?
、
、
蜂巢数据库
的
摄入非常缓慢。我计划执行一个DROP DATABASE temp_db CASCADE,重新创建由spark创建
的
新
表
,并更改SHOW CREATE TABLE temp_db.one_table生成
的
命令。我需要对每个
表
执行此操作,并将temp_db位置替换为新
的
原始位置。 有更好
的
方法吗?也许我可以重命名DB并为
表
设置一个新
的
位置。
浏览 4
提问于2022-03-11
得票数 0
回答已采纳
1
回答
使用无类型转换
的
空
列
写入时出错后,覆盖/
删除
Azure Databricks中
的
增量表
、
、
、
我曾尝试使用创建
的
空
列
写入增量表,如下所示: df = df.withColumn('val2', funcs.lit(None)) 使用以下函数 def write_to_delta_table(df'{path}/{fnm}' ''') 我得到了一个错误,并意识到我需要将null
列
转换为它
的
预期类型 df = df.withColumn('val2', funcs.lit(None).它显示了一个错误,例如 or
浏览 24
提问于2021-10-23
得票数 1
回答已采纳
1
回答
在开放源码
的
增量湖中创建
表
时,未创建文件。
、
、
、
我正在使用AWS电子病历,我使用
的
是一个开源
的
三角洲湖泊。但是我想在SQL中使用它。我尝试在SQL中创建一个delta
表
,如下所示。
spark.sql
('INSERT INTO test.foo (name) VALUES ("bar")'); 错误:org.apache.spark.sql.AnalysisException: Pathdoes not
浏览 7
提问于2022-11-04
得票数 0
2
回答
仅使用spark sql
删除
表
/视图中
的
列
、
、
我在一个
表
中有30
列
,即table_old drop_column=now_current_column var table_new=
spark.sql
(s"""alter table table_olddrop $drop_column"&q
浏览 7
提问于2018-11-01
得票数 3
1
回答
如何将一个数据
的
架构应用于另一个数据?
、
、
我有一个场景,我将一个文件作为字符串读取,我需要将它与
表
进行比较,以执行一些操作。df1 = sparkContext.parallelize(Seq(1,"aa")).toDF("Col1","Col2") // file因此,df1是from文件,它
的
两个
列
都是字符串,而df2
的
模式是Int和String。这只是一个示例,我有
浏览 2
提问于2017-07-03
得票数 1
回答已采纳
1
回答
在物理计划中执行交换和排序步骤
的
配置单元存储桶
表
、
、
、
我有两个
表
,它们都聚集在相同
的
列上,但是在连接聚集列上
的
两个
表
时,执行计划同时显示了交换和排序步骤。我希望在我
的
计划中避免排序和交换步骤,并且根据文档,存储桶
的
表
应该避免排序
浏览 1
提问于2019-06-12
得票数 1
2
回答
在jdbc数据源
上
激发SQL持久视图
、
、
、
、
我不明白为什么后者不能工作,但是找不到任何文档/提示,因为所有的示例都是用临时视图完成
的
。从技术
上
讲,我不明白为什么它不应该工作,因为数据是在临时视图中正确地从jdbc源检索
的
,因此,如果我想将查询“存储”在一个持久视图中,那么无论何时调用视图,它都可以直接从jdbc源检索数据。 dbtable '{tbl_in}', password '{db_pw}', url '{jdbc_url
浏览 14
提问于2022-10-27
得票数 0
回答已采纳
2
回答
如何在蔚蓝数据库中重命名数据库?
、
、
我试图在中重命名一个数据库,但是我得到了以下错误: %sql ALTER DATABASEinventory MODIFY NAME = new_inventory; 请解释这个错误是什么意思“输入‘alternative没有可行
的
选择”,我如何解决它?
浏览 4
提问于2021-03-05
得票数 4
2
回答
如何在蜂窝
表
中插入具有映射
列
的
数据帧
、
、
、
、
我有一个包含多个
列
的
dataframe,其中一个
列
是map(string,string)类型。我能够打印这个数据,有列作为地图,给数据地图(“双关”-> "Pune")。我想要将这个dataframe写到hive
表
(存储为avro),该
表
具有与map类型相同
的
列
。col("cname")) //table - created external hive table..sto
浏览 4
提问于2020-02-27
得票数 0
1
回答
捕获spark中执行
的
sql
的
异常
、
、
、
我有一个动态构建
的
SQL,其中包含一些损坏
的
字符串,比如列名错误,或者使用sm而不是sum。当我在这个生成
的
字符串上执行sparksession.sql()时,整个星火作业就会像预期
的
那样失败,我可以看到资源管理器日志中
的
所有日志。是否有一种方法可以让我在一个try catch块中捕获这个异常,并处理这个异常并继续我
的
逻辑。
浏览 6
提问于2019-10-22
得票数 2
1
回答
匹配一组停用词并替换为Pyspark中
的
空格
、
、
、
、
我在一个
表
中有一个地址
列
,如下所示 >>>
spark.sql
("select add1 from test").show(10,False)+---------------------------+ 我必须匹配一组单词,并将它们从
列
中
删除
,以便进行比较 我可以像下面这样用空格替换单个单词(本例中为‘UAE’)
spark.sql
("se
浏览 3
提问于2020-08-27
得票数 0
回答已采纳
2
回答
当源
表
行中
的
多
列
与目标
表
中单行
的
相同
列
匹配时,从目标火花增量表中
删除
一行
、
、
、
、
当行中
的
某些
列
值与Source
表
中
的
相同
列
值匹配时,我希望更新databricks中
的
目标Delta
表
。 display(
spark.sql
("select * from
浏览 2
提问于2020-06-08
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何批量删除文件名中的指定文字名称?批量重命名技巧快点拿去
MySQL数据库应用总结—MySQL数据库视图的操作
【干货】MySql
SQL server创建数据库和表
Mysql命令实践
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券