腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
创建具有可变函数
的
新列
、
、
如果这种问题不能用火花解决的话,我很惊讶:# in this format: YYYY-MM-DD (year, month, day) ... ...我收到这个错误: Error: org.apache.spark
浏览 4
提问于2016-10-27
得票数 3
回答已采纳
1
回答
如
何在
sparklyr
中
删除
字符串
中
的
'\‘
、
、
、
我正在使用
sparklyr
,并且有一个spark数据帧,它有一个包含单词
的
列word,其中一些单词包含我想要
删除
的
特殊字符。, '')) 现在我想
删除
\。
浏览 11
提问于2018-09-03
得票数 2
回答已采纳
1
回答
sparklyr
-在Apache Spark Join
中
包含空值
、
、
、
、
问题有Scala、PySpark和SparkR
的
答案,但没有
sparklyr
的
答案。我一直不知道如何让
sparklyr
中
的
inner_join将join列
中
的
NULL值视为相等。有人知道如
何在
sparklyr
中
做到这一点吗?
浏览 0
提问于2019-01-03
得票数 2
2
回答
如
何在
sparklyr
中
重新划分数据帧
、
、
我可以很容易地在pyspark和sparkr中找到这个函数,但是
sparklyr
中
似乎没有这样
的
函数。 有人知道如
何在
sparklyr
中
重新划分星火数据吗?
浏览 3
提问于2017-05-29
得票数 2
回答已采纳
1
回答
带状态
的
sparklyr
流连接
、
、
Spark提供了一些很棒
的
流媒体功能。最近, R通过使用结构化流
的
sparklyR
获得了流功能。如
何在
sparklyR
中使用这些窗口功能?withWatermark("timestamp", "10 minutes"),在哪里可以找到window($"timestamp", "10 minutes", "5 minutes"),如何将移植到
spa
浏览 0
提问于2019-04-10
得票数 0
2
回答
使用正则表达式清除
sparklyr
中
的
字符串
、
、
、
我正在尝试使用regexp_replace清理
sparklyr
中
的
表
中
的
字符串
。我需要
删除
单词之间
的
多个空格和特定
的
整个单词。pharms <- spark_read_parquet(sc, 'pharms', 's3/path/to/pharms', infer_schema = TRUE, memory = FALSE) 要清理
的
向量我想
浏览 19
提问于2020-07-17
得票数 0
1
回答
无法将SparkR::sampleBy函数应用于
sparklyr
数据SparkR
、
、
、
我
的
环境是Databricks。seed = 12345) 错误(函数(类、fdef、mtable):无法为函数‘sampleBy’找到用于签名‘“tbl_spark”、“字符”、“列表”、“数字”
的
继承方法
浏览 0
提问于2019-09-03
得票数 1
回答已采纳
2
回答
读取csv函数时出错
、
在google计算集群
中
,我正在尝试使用
sparklyr
包将csv文件读取到strudio
中
。配置如下:install.packages("
sparklyr
") spark_installsc <- spark_connect(master = "yarn-client", config=config ,version = &q
浏览 1
提问于2017-04-05
得票数 0
2
回答
Sparklyr
用
字符串
填充
、
我想在
sparklyr
数据帧上填充值(用以前
的
值替换NAs ),该字段保存
字符串
。我想改变这一点: ID, String2 NaN4 NaN 要这样做: ID, String2 a4 b 有没有办法在
sparklyr
中
做到这一点?
浏览 29
提问于2019-01-18
得票数 2
1
回答
如何使用数据库让dplyr::summarize_all在sparkdataframe上工作?
、
、
、
问题 我有一个巨大
的
Spark Dataframe,叫做x。我正在使用databricks。X有数十亿条记录,太大了,不能收集到一台机器上。我要怎么做才能让它正常工作?: dplyr::summarize_all(x,mean) 更多信息 这是我目前收到
的
错误消息: Error in UseMethod("tbl_vars") : no applicable method"SparkDataFrame“attr(,"package") 1 "SparkR” Mastering Spark wi
浏览 17
提问于2020-09-24
得票数 2
回答已采纳
1
回答
使用
sparklyr
删除
/更新分区
、
、
、
、
我使用
sparklyr
的
spark_write_table函数将表写入到HDFS
中
,并使用partition_by参数定义如何存储它们: spark_write_table在Hadoop-SQL
中
,我会这样做:PARTITION (col1 = 'my_partition') VALUES (myvalues..)在
sparklyr
中
是否有相应
的
浏览 0
提问于2018-01-26
得票数 2
1
回答
如何将SparkR转换为
sparklyr
?
、
、
、
如何将SparkR
中
的
SparkDataFrame转换为
sparklyr
中
的
tbl_spark有什么建议可以解决这个问题吗? 谢谢!
浏览 6
提问于2020-11-06
得票数 2
1
回答
R火花包作为火花
的
前端有多快?
、
、
、
、
我还看到了不同前端之间
的
比较,得出
的
结论是R太慢,以至于测试人员放弃了测试它
的
性能(;虽然这是对用户定义
的
函数
的
专门测试,并且可能没有使用
sparklyr
包)。我还知道
sparklyr
现在有了arrow集成,这导致了用户定义函数
的
性能改进,以及将数据复制到集群或从集群复制数据,
如
所示。我
的
问题是:与Python/Scala相比,
sparklyr
的
速度有多快?主要对标准<
浏览 3
提问于2019-09-29
得票数 3
3
回答
Sparklyr
中
的
Concat_ws()函数丢失
、
我正在学习一个关于web (Adobe)分析
的
教程,在那里我想要构建一个马尔可夫链模型。()。我
的
问题是:是否有其他方法可以访问concat_ws()函数?不幸
的
是没有结果。 函数
的
目标是什
浏览 0
提问于2018-10-12
得票数 2
回答已采纳
1
回答
删除
闪烁栏
中
的
NA列
、
、
、
我有一个有75列
的
数据表,其中12列有全部NA,有些列有70% NA,我想
删除
具有>=70% NA
的
列。df[,!apply( df , 2 , function(x) all(is.na(x)) ) df[= nrow(df)]df[, colSums(is.na(df)) < nrow(df)] colSums<e
浏览 2
提问于2017-03-23
得票数 2
回答已采纳
2
回答
在
sparklyr
中
禁用配置单元支持
、
有没有办法在
sparklyr
中
禁用hive支持?sparkR.session(master="local[*]", enableHiveSupport=FALSE)
浏览 9
提问于2017-01-10
得票数 5
回答已采纳
2
回答
删除
sparklyr
中
的
重复行
、
、
、
我需要使用
sparklyr
根据另一列
中
的
重复项
删除
在一列
中
重复
的
行。基R法iris_order = iris[order(iris[,'Sepal.Lengthduplicated(iris_order$Sep
浏览 7
提问于2020-01-12
得票数 1
回答已采纳
1
回答
带
Sparklyr
的
矩阵数学
、
、
、
希望将一些R代码转换为
Sparklyr
,函数
如
lmtest::coeftest()和三明治::三明治()。尝试开始使用
Sparklyr
扩展,但对Spark非常陌生,并且有问题:(第一步是使用linalg库创建一个对象: library(
sparklyr
java.lang.Exception: No matched constructor found for class org.apache.spark.mllib.linalg.Dens
浏览 2
提问于2017-06-17
得票数 14
回答已采纳
2
回答
未能从SPARK_HOME或SPARK_HOME_VERSION检测到版本
我试图在DSX上使用来自
的
RStudio火花,但是我遇到了以下错误:> sc <- spark_connect(master = "CS-DSX") 所以我看了一下SPARK_HOME[1] "/opt/spark"更新
浏览 9
提问于2017-02-16
得票数 0
1
回答
与Kerberos
的
连接
、
、
、
我能够通过Livy服务连接到非Kerberized集群,而不会出现来自远程Rstudio桌面(windows)
的
问题。但是,如果启用了Kerberos安全性,则连接将失败:sc <- spark_connect("http://host:8998", method = "livy"Try spark_connect with config = livy_config() 使用
sparklyr
_0.5.6-9002和进行身份验证。另一方面,
浏览 1
提问于2017-06-23
得票数 5
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
JavaScript删除字符串中重复字符
如何在 Bash 中抽取子字符串
如何在Excel 表格中批量删除多余的空行?
如何在Excel VBA中添加或删除模块
PPT如何在组合中添加或删除对象
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券