腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
SparkSQL
是关系数据库管理系统还是NOSQL?
、
、
、
、
最近,当我们遇到这个问题时,我正在和我的朋友讨论
SparkSQL
的特性。它们是酸性交易吗?
SparkSQL
是否遵循CAP定理? 我对这个领域有点陌生,帮帮我吧。提前谢谢。
浏览 3
提问于2016-05-10
得票数 3
回答已采纳
1
回答
将一个表分发到另一个具有不同名称的表。
、
、
每当我需要
使用
distcp将数据从表item.name从C1复制到C2时。在运行distcp之前,我需要删除C2中的当前表,然后按顺序重新创建一个表。最后,以orc格式重新创建一个表。
使用
这种方法,我需要将数据从item.name中的C1复制到C2中的item.name_seq。在复制数据之后,我可以在item.name的C2中插入orc表。这个方法好吗?这是可能的吗?基本上,
使用
distcp,我需要将数据从item.name中的C1复制到C2中的item.name_seq。 如果你有更好的方法,请告诉我。
浏览 4
提问于2022-09-07
得票数 0
1
回答
使用
Python从
MySQL
数据库表中读取
SparkSQL
、
、
我在
MySQL
中有一个'user‘表。我想把它读到我的Spark SQL程序中。如何
使用
Python将表从
MySQL
读取到Apache Spark的
SparkSQL
模块?
浏览 0
提问于2016-04-25
得票数 12
1
回答
相当于
MySQL
在Apache
SparkSQL
中的“杀死查询”?
MySQL
的命令kill query (定义为)是否等同于Apache
SparkSQL
?谢谢!
浏览 2
提问于2017-10-17
得票数 0
回答已采纳
1
回答
相当于
MySQL
在
SparkSQL
中的“显示处理列表”
在
MySQL
的命令show processlist;中有Apache
SparkSQL
的等价物吗?
浏览 3
提问于2017-10-17
得票数 0
回答已采纳
1
回答
SparkSQL
/Hive:相当于
MySQL
的`information_schema.table.{data_length,table_rows}?
、
、
、
在
MySQL
中,我们可以查询表information_schema.tables并获得有用的信息,例如data_length或table_rows。-----------++-------------+------------+是否存在与
SparkSQL
我可以
使用
SparkSQL
或像HiveMetaStoreClient (java org.apache.hadoop.hive.metastore.HiveMeta
浏览 1
提问于2018-03-09
得票数 3
回答已采纳
1
回答
sparksql
如何批量插入数据到
mysql
?
、
、
最近我需要
使用
sparksql
在
mysql
中插入大约100,000,000个数据,但是速度相当慢,大约需要1个小时。有人能找到一种有效的插入方法吗?
mysql
配置=>prop.setProperty("password", "password") prop.setProperty(
浏览 28
提问于2018-08-01
得票数 4
2
回答
使用
SparkSQL
删除
MySQL
表
、
、
、
我知道我们可以通过以下命令从
SparkSQL
查询或创建
Mysql
表。
浏览 0
提问于2016-02-24
得票数 3
1
回答
Spark SQL 2.1是否支持将临时表或hive表写入
Mysql
/Oracle?
我
使用
的是Spark SQL 2.1, 我可以在Spark SQL中以临时视图的形式从
mysql
/oracle中读取数据: val url = "jdbc:
mysql
://localhost:3306password '$pass', numPartitions '3') val session = SparkSession.builder().appName(&q
浏览 9
提问于2019-03-29
得票数 0
1
回答
SparkSQL
中不带聚合函数的GROUP BY
、
、
我正在尝试在
SparkSQL
中重现与sql中的group by相同的行为。下面是一个
使用
SQL而不是
使用
SparkSQL
函数在
SparkSQL
中所能完成的操作的示例: 输入数据集: val input = Seq( ("Toronto: input.createOrReplaceTempView("input") 然后通过
使用
sql select city, year, count fr
浏览 26
提问于2021-08-30
得票数 0
回答已采纳
1
回答
通过集群提高
SparkSQL
查询性能
我是
SparkSQL
新手,我主要负责编写
SparkSQL
查询。我们经常需要在查询中
使用
JOIN大表,并且不需要很长时间就会遇到与它们相关的性能问题(例如。Joins、aggregates等)。在网上搜索补救方法时,我最近遇到了一些术语-- COALESCE()、REPARTITION()、DISTRIBUTE BY、CLUSTER BY等,而且它们可能用于提高慢速运行的
SparkSQL
查询的性能我主要是寻找一些例子来解释它们的语法、提示和
使用
场景。 有谁能在这里帮助我,并提供
SparkSQL</
浏览 5
提问于2020-06-05
得票数 0
1
回答
在
SparkSQL
中
使用
Avro模式和Parquet格式进行
读写
、
、
、
我正在尝试从
SparkSQL
中写入和读取镶木面板文件。出于模式演变的原因,我希望在写入和读取时
使用
Avro模式。我的理解是,这在Spark之外(或在Spark内手动)是可能的,例如
使用
AvroParquetWriter和Avro的通用API。但是,我想
使用
SparkSQL
的write()和read()方法(它们与DataFrameWriter和DataFrameReader一起工作),它们与
SparkSQL
很好地集成在一起(我将编写和读取Dataset换句话说,似乎没有办法通过Avro模
浏览 1
提问于2017-01-04
得票数 5
1
回答
使用
bcl.DateTime字段在proto case类上创建数据帧抛出none不是术语异常
、
我有一个通过scalapb从.proto文件生成的case类,它有几个bcl.DateTime类型的字段。case类定义如下: @SerialVersionUID(0L) customerid: _root_.scala.Int = 0, orderId: _root_.scala.Long = 0L, dataFeedId: _root_.scal
浏览 17
提问于2020-07-10
得票数 0
回答已采纳
1
回答
哪一个更适合在
MySQL
中存储非公历日期时间?datetime+PHP转换或varchar或Unix时间戳为int
、
、
我需要按顺序和where语句
使用
它们,以便在HTML中显示完整的表内容。通过考虑和
MySQL
的执行时间(),哪一种方案可以提高性能?1)在每次
读写
和
使用
MySQL
时,
使用
PHP将非gregorian转换为gregorian。2)在每次
读写
和
使用
MySQL
int/bigint时,
使用
PHP将非Gregorian转换为UNIX时间戳。 ( 3)
使用
MySQL
varchar
浏览 9
提问于2016-07-14
得票数 1
1
回答
无法将SparkR::sampleBy函数应用于sparklyr数据SparkR
、
、
、
我
使用
df_pqt_tbl <- spark_read_parquet(...)函数读取了一个拼花文件。我的环境是Databricks。我想
使用
SparkR::sampleBy函数进行分层抽样,但是我得到了一个错误: 有没有一种方法可以将一个tbl_spark转换成一个火花数据,这样我就可以在它上<em
浏览 0
提问于2019-09-03
得票数 1
回答已采纳
1
回答
使用
几个GBs大小的数据集的
sparksql
、
、
I有多个表,其中一些表包含~50M行50%的查询利用索引和多个工作人员更快地完成查询。我的一些查询
使用
join命令如果我有多台服务器要运行,那么
使用
sparkSQL
可以获得更好的性能吗?是否适合
使用
sparkSQL
或postgresSQL ?的数据集? 什么时候选择
sparkSQL
而不是postgresSQL ?
浏览 2
提问于2021-01-04
得票数 1
回答已采纳
1
回答
SparkSQL
:读取JSON还是直接对文件执行查询?
、
我刚刚开始
使用
SparkSQL
,并且正在努力确保我理解从文件
使用
SparkSQL
(并推断出模式)和
使用
之间的好处。如果你有任何
使用
SParkSQL
的经验,我很想知道哪种方法是首选的,为什么。
浏览 1
提问于2016-11-09
得票数 0
2
回答
MySQL
能否在10 vs的网络存储上与本地硬盘相比表现更好?
、
、
、
、
与在本地计算机上
使用
HDD并在其上执行许多
MySQL
读写
相比,如果我安装10 the网卡并将
MySQL
数据存储在由多个HDD组成的raid网络存储上,它是否每秒会有更多的查询?或者网络延迟(或其他什么)会成为
MySQL
性能的问题吗? 我的目标是在不磨损SSD的情况下接近SSD的
读写
性能。
浏览 0
提问于2022-05-16
得票数 1
2
回答
为什么在星火上
使用
Hive而不是Spark?
、
、
、
我是数据科学领域的新手,我不明白为什么有人会想要将Hive连接到Spark,而不是仅仅
使用
Sqark-SQL。在星火上
使用
Hive而不是Spark有什么好处(除了能够在生产中
使用
Hive代码之外)? 谢谢
浏览 5
提问于2015-05-12
得票数 2
回答已采纳
2
回答
使用
Spark SQL中的regex函数从字符串中提取特定数字
、
我在
mysql
中有一个表,它有POST_ID和相应的兴趣:我
使用
下面的正则表达式查询来选择包含1,2,3的兴趣。但是,当我在
SparkSQL
中
使用
相同的查询时,它显示空记录。 如何在spark中
使用
REGEXP函数来选择包含1,2,3的兴趣?
浏览 2
提问于2017-12-13
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券