腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
GCP
中
的
PySpark
内核
-
unicode
字符串
、
、
我有一个包含
字符串
的
列
的
dataframe。当我调用函数时:但是,当我打印时,我得到了正确
的
“视图”结果是带有
unicode
符号
字符串
,如u'mystring' 我该如何解决这个问题呢?
浏览 11
提问于2019-12-02
得票数 1
回答已采纳
1
回答
如何使用气流和pass参数触发google作业
、
、
、
、
作为DAG
的
一部分,我正在使用下面的代码触发
gcp
pyspark
dataproc作业,
gcp
_conn_id=
gcp
_conn_id, main=
pyspark
_script_location_gcs, cluster_name=cluster_name, job_name="job
浏览 1
提问于2021-02-10
得票数 2
回答已采纳
2
回答
如果"env“参数包含
unicode
对象,为什么Popen在Windows上失败?
、
)我已经将错误追溯到这个CPython代码: 不过,我不能理解PyUnicode_Check是怎么做
的
:
浏览 1
提问于2012-09-04
得票数 11
回答已采纳
2
回答
未知解释器
PySpark
。toree无法安装
PySpark
当我为木星笔记本安装
PySpark
时,我使用以下cmd:但是,我知道所以我不知道有什么
浏览 0
提问于2019-03-15
得票数 9
1
回答
在EMR上向木星/木星中心
的
PySpark
内核
添加库
、
、
我试图在
PySpark
3
中
使用Matplotlib,JupyterHub (0.9.4)在AWS (5.20)上
的
码头上运行。在该JupyterHub上预装了4个
内核
: Python、
PySpark
、
PySpark
3和Spark。使用Python
内核
导入Matplotlib没有问题。但是,当我尝试使用
PySpark
或
PySpark
3
内核
“导入matplotlib作为plt”时,我得到了消息"matplotl
浏览 0
提问于2019-01-13
得票数 2
回答已采纳
1
回答
如何用火花-scala删除rdd
中
的
unicode
?
、
、
、
1991;113;High Heels;Comedy;Bos�, Miguel;Abril, Victoria;Almod�var, Pedro;68;No;NicholasCage.png 如何删除
Unicode
并使用Spark
中
的
Scala将
字符串
映射为标准
字符串
格式。注意:我确实提到了
PySpark
解决方案,但我正在寻找基于Scala
的
解决方案。
浏览 1
提问于2018-03-28
得票数 1
回答已采纳
1
回答
用
中
的
自定义模式读取
pySpark
中
的
JSON
、
、
、
、
在
GCP
(使用
pySpark
)
中
,我正在执行一项任务,即按照自定义模式读取JSON文件并将其加载到Dataframe
中
。)得到以下结果,现在,我需要检查Dataframe
中
的
数据,当我尝试执行df_2.show()时,需要花费太多
的
时间并显示为
内核
繁忙
的
数小时。我需要帮助,这就是我在代
浏览 0
提问于2021-03-22
得票数 2
2
回答
Ubuntu 16.04
内核
版本4.15.0-1021-
gcp
的
TCP SACK修复
、
、
我在Google中有服务器,运行Ubuntu16.04
内核
版本4.15.0-1021-
gcp
. 针对某些漏洞修复
的
修复方法是最近发布。我对此有疑问:我需要更新
内核
吗?如果是的话,我该怎么做呢?
浏览 0
提问于2019-06-26
得票数 0
2
回答
为木星创建火花源
内核
、
、
、
我在看Apache,它是木星
的
皮斯克
内核
。 { "language": "python", "/usrpython/lib/py4j-0.9
浏览 0
提问于2016-01-25
得票数 13
回答已采纳
1
回答
启动jupyter-
pyspark
内核
时生成损坏
的
文件
、
、
我们已经在两个带有
pyspark
内核
的
linux hadoop服务器上安装和设置了jupyter笔记本。这两个服务器具有相同
的
kernel.jason配置,具有相同
的
spark和pyhton版本。在一台服务器上jupyter notebook ui -->
pyspark
内核
工作正常,但在另一台服务器上启动
pyspark
内核
时,有一个文件(名称为-?)是在用户主目录中生成
的
,能够在打开
的
<em
浏览 33
提问于2019-08-20
得票数 0
1
回答
如何在从
GCP
dataproc集群
中
旋转
的
datalab实例
中
强制python版本同步?
、
、
我已经使用图1.2在
GCP
中
创建了一个Dataproc集群。我想在Datalab笔记本上运行Spark。如果我让Datalab notebook运行Python2.7作为它
的
内核
,这很好用,但是如果我想使用Python3,我会遇到一个小
的
版本不匹配。import DecisionTree, DecisionTreeModelfrom
pyspark
.mllib.regressioncanno
浏览 15
提问于2019-04-02
得票数 1
回答已采纳
1
回答
木星上
的
火花核会产生“火花未被发现”
的
错误。
、
、
我有一些
pyspark
内核
jupyter笔记本已经工作了几个月,但最近不再工作了。
pyspark
内核
本身正在工作:它给出了蓝色消息:。。我们可以看到
内核
是可用
的
但是我在jupyter日志中注意到了这一点:
浏览 0
提问于2018-11-17
得票数 0
回答已采纳
1
回答
Dataproc:
pyspark
UDF
的
functools.partial no attribute '__module__‘错误
、
、
、
我正在使用
GCP
/Dataproc进行一些spark/graphframe计算。在我
的
私有spark/hadoop独立集群
中
,在定义pysparkUDF时使用functools.partial是没有问题
的
。 return base ** exponent 在主函数
中
,正如我
浏览 4
提问于2018-08-01
得票数 0
1
回答
在Sagemaker笔记本
中
的
PySpark
内核
中
安装python包
、
、
有人想出了如何在AWS Sagemaker Notebook实例上安装软件包,以便在
PySpark
内核
中
可用吗?我现在做了几次尝试,包括生命周期脚本,但似乎就是错过了正确
的
python env。有问题
的
包是joblib,但我猜它不应该有什么关系?!
浏览 12
提问于2019-12-23
得票数 3
2
回答
pyspark
引发TypeError: textFile()缺少一个必需
的
位置参数:“name”
、
、
、
、
我在谷歌上搜索了这个问题,但没有直接回答与spark-2.2.0-bin-hadoop2.7相关
的
问题。我正在尝试从本地目录读取文本文件,但我总是得到缺少name参数
的
错误消息。这是jupyter notebook中使用Python3
的
代码:data = sc.textFile("/home/bigdataTraceback (most recent call last) <ipython-input-7
浏览 2
提问于2017-12-06
得票数 5
回答已采纳
1
回答
修改jupyter
内核
以在spark
中
添加cassandra连接
、
、
、
我有一个木星
内核
和
PySpark
一起工作。"我想修改这个
内核
以添加到cassandra
的
连接。在脚本模式
中
,我键入: --packages anguenot:
pyspark
-cassandra:0.7.0 \我应该将这些信息输入到
内核
中
吗?启动
内核</
浏览 2
提问于2018-06-01
得票数 0
1
回答
AWS JupyterHub火花放电笔记本使用熊猫模块
、
、
、
、
我安装了一个带有JupyterHub
的
码头容器,运行在AWS集群上,如本文所述,。它有Python3
内核
、
PySpark
3、
PySpark
、SparkR和SparkR,在容器
中
安装了conda和许多其他Python包,但是没有火花。问题是,当我运行
pyspark
或
pyspark
3
内核
时,它会连接到安装在主节点(在坞容器之外)上
的
spark,并且所有内部模块都不再用于此笔记本(虽然它们对python
内核
是可见
浏览 0
提问于2018-09-19
得票数 4
1
回答
将SUSE SP3降级为SP2
、
、
、
是否有人可以从SAP SP3
的
SUSE迁移到SP2,而不会丢失
GCP
实例
中
现有的设置和配置。高级超视距我在SP2
中
没有任何要还原
的
备份,而且我不希望将服务器重新构建为SP2,因为我冒着对系统进行完全重新配置
的
风险。因此,对于
GC
浏览 13
提问于2021-11-02
得票数 1
回答已采纳
2
回答
无法在iPython
中
实例化火花上下文
、
、
、
、
我试图在mac上本地设置一个独立
的
spark实例,并使用Python3API。为此,我完成了以下操作: 1.下载并安装了Scala和Spark。=python3export
PYSPARK
_DRIVER_PYTHON_OPTS="notebook" export PYTHONPATH=$SPARK_HOME/python/lib/py4j-0.10.
浏览 1
提问于2018-02-07
得票数 0
回答已采纳
1
回答
使用SageMaker和
PySpark
的
AWS笔记本电脑列表表
、
、
、
在AWS SageMaker
中
执行以下代码有一些困难。它应该只列出DynamoDB
中
的
所有表。"conda_python3“,那么代码执行得很好,并且按预期在笔记本
中
列出了表(这几乎是立即发生
的
)。但是,如果我将
内核
设置为"Sparkmagic (
PySpark
)“,那么相同
的
代码将无限地运行,并且根本不输出表列表。有人知道为什么
PySpark
内核
会出现这种情况,而conda3
内核</em
浏览 3
提问于2019-11-22
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
关于unicode字符串写入python报错的问题
Python中的bytes、str以及unicode区别
解惑:关于Unicode字符串的一些名词解释
GCP发布Kaniko:在非特权容器和Kubernetes中构建容器镜像的工具
TDSQL中修复的mysql内核bug
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券