腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
spark.read.format('libsvm')不使用python
、
、
我正在学习
PYSPARK
,遇到了一个我无法修复的问题。我按照这段
视频
从
PYSPARK
文档中复制代码来加载线性回归的数据。当我在Jupyter notebook中运行这段代码时,它总是给我一些java错误,这个
视频
中的人和我做了完全相同的事情,但他没有得到这个错误。有人能帮我解决这个问题吗? 非常感谢!
浏览 0
提问于2019-12-09
得票数 2
1
回答
py4JJavaError:调用o253.load时出错。:java.lang.ClassNotFoundException:未能找到数据源: bigquery
、
、
阅读和观看教程
视频
,但没有一个似乎是有效的。寻求指导import
pyspark
from
pyspark
import SparkContext,SparkConf from
pyspark
.sql.functions import window, col, year, month, aggregate, date_add,timestamp_seconds, rank, split
浏览 9
提问于2022-02-04
得票数 -1
1
回答
火花上的Kedro气流
、
、
在spark上寻找kedro+ airflow的实现。这个插件现在可以用于spark了吗? 查看了PipelineX,但在spark上找不到相关的示例?
浏览 8
提问于2020-08-14
得票数 0
2
回答
使用
pyspark
创建SparkSession时遇到的问题
、
、
、
我正在尝试从
pyspark
.sql创建一个session,以便加载一个.csv文件。但是,每次我试图执行第2行时(如下面所示),该命令将持续执行数小时&永远不会生成代码的其他行。solution").config("spark.some.config.option", "some-value").getOrCreate() ~\anaconda3\lib\site-packages\
pyspark
~\anaconda3\lib\site-packages\
pyspark
\conte
浏览 4
提问于2020-07-23
得票数 5
1
回答
'HiveContext‘对象没有属性'jsonRDD’Spark2.1.1
、
、
、
、
我正在
PySpark
上学习一个
视频
课程。我试图使用下面的代码将json字符串转换为dataframe。import
pyspark
as ps sc = ps.SparkContext
浏览 2
提问于2017-10-02
得票数 2
回答已采纳
1
回答
PySpark
调用java api,然后java api调用Apache Spark中的scala api吗?
、
、
、
、
我正在尝试理解Apache
PySpark
是如何工作的。
视频
: Spark Python API - Josh Rosen说Python API是Java API的包装器。它在内部调用Java方法。检查时间戳6.41 1)这意味着对于
PySpark
中每个方法,如map、reduce等,它将在Java语言中调用相应的方法5)我在IntelliJ中使用
PySpark
,并且已经从加载了源代码。 是否可以从
PySpark
到Scal
浏览 0
提问于2017-10-21
得票数 1
1
回答
能否将Intellij python解释器设置为虚拟set (类似于py魅力中的)
、
、
我需要为python解释器执行一些自定义设置:与
pyspark
特别相关:"interpeter“实际上将是spark-submit (又名
pyspark
) shell脚本。其目的是能够在中运行
pyspark
作业。在Run Configuration中运行也很好:这将是另一种方法。我使用IJ终极版--它有很好的python支持:除了这个特定的用例之外。我想把它设置为$SPARK_HOME/bin/
pyspark
?
浏览 3
提问于2017-02-26
得票数 0
回答已采纳
1
回答
错误:必须指定主资源(JAR、Python或R文件)- IPython记事本
、
、
我尝试在IPython笔记本中运行Apache,遵循以下内容(以及注释中的所有建议)- ipython notebook --profile=
pyspark
=true"
pyspark
-shell'# Configure the necessary' to # the end of
浏览 7
提问于2015-07-02
得票数 7
3
回答
我应该如何在Ubuntu 12.04上集成Jupyter notebook和
pyspark
?
、
、
、
、
我是
Pyspark
的新手。我在ubuntu上安装了"bash Anaconda2-4.0.0-Linux-x86_64.sh“。还安装了
pyspark
。在终端中一切工作正常。当我在我的ubuntu终端中创建配置文件时,如下所示:[ProfileCreate] Generating default config file: u'/home/wanderer/.ipyt
浏览 0
提问于2016-04-24
得票数 3
1
回答
CDH5.12上Spark2.2的IPython安装
、
、
、
我在CDH5.12和RHEL上有一个包含Spark2.2的集群,我正在尝试设置IPython以与
pyspark
2一起使用。我已经安装了IPython 5.xLTS(长期支持),但是我不能让它工作。
浏览 3
提问于2017-10-31
得票数 0
2
回答
使用Apache Spark Submit提交Python应用程序
、
、
command#setting path for Sparkexport
PYSPARK
_DRIVER_PYTHON="jupyter"alias snotebook='$SPARK_PATH/bin/
pyspark
--master
浏览 1
提问于2016-09-03
得票数 0
2
回答
CreateProcess error=5,访问被拒绝-火花源
、
、
、
count / NUM_SAMPLES 1129 1120 1121 def count(self)
浏览 4
提问于2020-02-26
得票数 0
2
回答
cPickle.PicklingError:无法序列化对象: NotImplementedError
、
、
、
、
python/
pyspark
/serializers.py", line 590, in dumps
pyspark
_1 | File "/home/ubuntu/spark-2.4.4-bin-hadoop2.7/python/
pyspark
/cloudpickle.py", line/
浏览 2
提问于2019-10-25
得票数 2
回答已采纳
3
回答
java.io.IOException:无法运行程序"python3":CreateProcess error=2,系统找不到指定的文件
、
、
在PYCHARM上运行
pyspark
程序时,我得到以下错误,Error: java.io.IOException:无法运行程序"python3":CreateProcess error=2,系统找不到指定的文件
浏览 9
提问于2021-08-08
得票数 9
1
回答
使用“导入
pyspark
.pandas”导入错误
、
、
、
我试图安装火花放电,我打算使用
pyspark
.pandas。我试着这样检查我的包裹。import pandas as pdimport
pyspark
.pandas as ps 但是当我运行导入时,我会看到下面的错误。ImportError: cannot import name 'print_exec' from '
pyspark
.cloudpickle' (C:\Users\smith\Anaconda3\lib\site-packages\
pysp
浏览 6
提问于2022-06-25
得票数 0
回答已采纳
2
回答
AttributeError:不能在<模块'
pyspark
.cloudpickle‘>上获得属性'_fill_function’>来自‘
pyspark
/cloudpickle/__init_..py’>
、
、
当从脚本中执行
pyspark
代码时。在df.show()时获取以下错误。from
pyspark
.sql.types import StructType,StructField, StringType, IntegerTypedf.show(truncate=False) AttributeError: Can't get attribute '_fill_function' on <m
浏览 12
提问于2021-06-06
得票数 2
4
回答
Python导入语法:我不认识这个(“它错了.”)
、
PySpark
的文档在示例中包括以下内容:from
pyspark
.sql.functions import *from datetime import date, timedelta, datetime 我不认识或理解最后两行的语法。
浏览 5
提问于2022-06-15
得票数 0
回答已采纳
13
回答
火花上下文'sc‘未定义
、
、
我是新来的火花,我试图安装的
PySpark
参考下面的网站。 在朋友的帮助下,我能够通过更正.ipython/profile_
pyspark
/startup/00-
pyspark
-setup.py文件的内容来修复与相关的问题 我现在只有星火上下文变量的问题
浏览 13
提问于2015-06-10
得票数 29
回答已采纳
1
回答
气流DataprocSubmitJobOperator - ValueError:协议消息作业没有"python_file_uris“字段
、
、
、
、
我正在使用气流中的DataprocSubmitJobOperator来安排火花放电作业,而且当我无法将pyfiles传递给火花放电作业时达格
PYSPARK
_JOB"reference": {"project_id": PROJECT_ID}, "
pyspark
_job": {
浏览 10
提问于2022-07-17
得票数 1
回答已采纳
3
回答
上个星期一去火场
、
、
、
我可以这样做:
pyspark
.sql.types.StructField('AccountCreationDate',
pyspark
.sql.types.DateType(), True), <e
浏览 7
提问于2016-10-26
得票数 10
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PySpark数据分析基础:PySpark原理详解
pyspark 安装
PySpark调优
PySpark安装+Jupyter Notebook配置
如何使用pyspark统计词频?
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券