腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(8837)
视频
沙龙
1
回答
用纱线客户端代替livy的Sagemaker
笔记本
到
EMR
火花源
python
、
pyspark
、
amazon-emr
、
amazon-sagemaker
我知道,关于如何通过SparkMagic预装的内核将Sagemaker
笔记本
连接到
EMR
集群
上,有很好的教程,但是我们希望
使用
纱线-客户端模式(而不是livy )连接到
集群
,以便能够
使用
我们已经拥有的Sagemaker实例
中
的库和信任,这个想法是在巨大的数据集上运行python代码,获得摘要,并
使用
我们在sag产
笔记本
中
已经拥有的大量python库和
自定义
内部库来完成摘要的分析任务,我一直在搜索,但
浏览 8
提问于2022-06-13
得票数 0
1
回答
运行Spark的
EMR
笔记本
-如何从私有github分支安装其他库
apache-spark
、
jupyter-notebook
、
amazon-emr
我想在
EMR
Notebook virtualenv
中
安装一个python库,就像在sc.install_pypi_package("arrow==0.14.0", "https://pypi.orgpython库并不是以pypi包的形式发布的,而是位于私有github存储库的
自定义
分支上。我如何才能参考git repo并为AWS
EMR
提供相关的git凭据才能正常工作?这个库是否也可用于Spark
EMR
集群
(UDF
函数</em
浏览 3
提问于2020-01-01
得票数 2
1
回答
如
何在
EMR
集群
中
跨
Jupyter
笔记本
使用
自定义
用户
定义
函数
?
scala
、
apache-spark
、
pyspark
、
apache-spark-sql
、
amazon-emr
我想与我们的数据科学家在
EMR
集群
中
使用
pyspark和
jupyter
的其他
集群
分享我在Scala
中
创建的udf。 这个是可能的吗?多么?
浏览 10
提问于2017-07-03
得票数 2
1
回答
Spark内核
笔记本
之间的
集群
共享
amazon-web-services
、
apache-spark
、
jupyter-notebook
、
amazon-emr
、
amazon-sagemaker
我希望从概念上理解在Spark内核(
如
SparkMagic)上运行的几个
Jupyter
笔记本
如何共享一个工作节点
集群
。如果
用户
A在计算单元
中
持续或缓存了一个大的RDD (无论是在磁盘上还是在内存
中
),然后出去度周末,但没有停止他/她的
笔记本
,这是否会降低其他
用户
在
用户
A的
笔记本
运行时运行其作业的能力?也就是说,共享
集群
的所有Spark notebooks将能够同时提交作业
浏览 20
提问于2021-01-25
得票数 1
1
回答
如何
定义
Spark和驱动程序日志URL,使它们直接命中我的代理而不是火花主程序
apache-spark
、
nginx
、
jupyter-notebook
、
amazon-emr
环境:问题:从
用户
的角度来看,他们会点击
jupyter
笔记本
中</em
浏览 1
提问于2020-09-10
得票数 1
2
回答
使用
AWS
jupyter
笔记本
绘制Matplotlib
amazon-web-services
、
matplotlib
、
amazon-ec2
、
pyspark
我试图在AWS实例的
jupyter
笔记本
中
使用
Matplotlib绘制数据。Matplotlib必须在实例启动时通过引导操作安装,这一点我已经成功地完成了。我也成功地用这种方式安装了Pandas (并将其用于
笔记本
中
的各种东西)。典型的%matplotlib inline不工作。(事实上,在AWS
笔记本
上似乎没有神奇的命令。我怀疑AWS已经禁用了这些功能,或者这与
笔记本
的“无服务器”有关)。我试过: 安装matplotlib==2.0.2并
使用
%m
浏览 0
提问于2019-03-31
得票数 4
1
回答
为什么
EMR
笔记本
在作为AWS帐户所有者运行时不能连接到其群集
amazon-emr
我已经
使用
默认设置创建了AWS
EMR
集群
和
笔记本
。 我查看了由
笔记本
失败的
集群
创建的日志文件。/gateway.log.gz
中
,我发现了以下内容:
Jupyter
Enterprise Gateway 2.1.0 is available at http:
浏览 17
提问于2022-04-04
得票数 6
回答已采纳
2
回答
JupyterHub服务器无法在私有子网
中
运行的Terraformed
EMR
群集中启动
amazon-s3
、
terraform
、
amazon-emr
、
terraform-provider-aws
、
jupyterhub
我正在
使用
Terraform创建一个
EMR
集群
(
emr
-5.24.0),部署到一个私有子网,其中包括Spark、Hive和JupyterHub。我已经在部署
中
添加了额外的配置JSON,这应该会将Jupiter
笔记本
的持久性添加到S3
中
(而不是本地磁盘上)。 整个架构包括一个连接到S3的VPC端点,并且我能够访问我试图将
笔记本
写入的存储桶。资源
定义
中
,然后引用以下内容: configurations =
浏览 33
提问于2019-06-26
得票数 0
1
回答
如何将变量从
EMR
集群
传递到木星
笔记本
%%本地实例?
python
、
amazon-web-services
、
jupyter-notebook
、
jupyter
、
amazon-emr
当我
使用
%%local在托管木星
笔记本
实例上运行代码时,如何
使用
EMR
集群
的Python实例
中
定义
的变量示例: ln[1]: parameter
浏览 0
提问于2019-10-22
得票数 1
回答已采纳
1
回答
使用
AWS Step
函数
编制作业的
EMR
amazon-emr
、
aws-step-functions
、
aws-emr-studio
最近,亚马逊推出了,我想重新定位
使用
的现有数据管道编排:有一些步骤可以创建
EMR
集群
、运行一些lambda
函数
、提交火花作业(大部分是Scala作业
使用
火花提交),并最终终止
集群
。有些文档和github示例描述了从编排框架(
如
AirFlow )提交作业的情况,但没有描述如
何在
EMR
中
使用
AWS
函数
。在这方面的任何帮助都将受到赞赏。首先,我感兴趣的是重新
定义
arn:aws:state
浏览 7
提问于2022-06-10
得票数 1
1
回答
带有
EMR
和
Jupyter
笔记本
的Postgres JAR
postgresql
、
amazon-web-services
、
jupyter-notebook
、
amazon-emr
我正在尝试启动一个包含Postgres驱动程序JAR文件的电子病历
集群
,这样我就可以从Postgres加载数据并
使用
PySpark进行分析。我将我想要包含的JAR存储在S3
中
。connection-user": "MYUSER", }, } ] 2-添加JAR作为
自定义
步骤(从S3
中</em
浏览 13
提问于2021-04-06
得票数 2
回答已采纳
1
回答
AWS数据管道EmrCluster的安全配置字段
amazon-web-services
、
amazon-emr
、
amazon-data-pipeline
我通过AWS管理控制台上的常规
EMR
集群
向导创建了一个AWS
集群
,并且我能够选择一个安全配置,例如,当您导出CLI命令时,它是--security-configuration 'mySecurityConfigurationValue现在我需要通过AWS数据管道创建一个类似的
EMR
,但是我看不到任何选项可以指定这个安全配置字段。我已经在管道配置
中
填写了所有这些,但我只需要指定安全性配置。有什么想法吗?
浏览 0
提问于2018-05-15
得票数 1
回答已采纳
1
回答
Azure Synapse -在
笔记本
中导入python脚本
azure
、
azure-devops
、
azure-pipelines
、
azure-synapse
、
azure-sqldw
Am
使用
Azure Synapse与
jupyter
笔记本
相结合: 我的许多
jupyter
笔记本
都导入了一些
自定义
python脚本,比如util- import: 但是,在
中
没有选项保存*.py通常,当我
使用
导入功能时,*.py被转换为
笔记本
(在
笔记本
电脑上它是util.py,在Synapse导入之后是一个
笔记本
):如
何在
Azure
笔记本
中<
浏览 12
提问于2022-11-30
得票数 0
回答已采纳
3
回答
AWS
EMR
火花1.0
amazon-web-services
、
apache-spark
、
emr
有没有办法强迫亚马逊
EMR
使用
Spark1.0.1?当前可选择的版本停留在1.4.1。我在MLlib中
使用
交替的最小二乘实现,自v1.1以来,它们已经实现了加权正则化,并且出于特定的原因(研究研究),我不希望这个实现,而是我试图访问他们在v1.0
中
实现的非加权正则化版本。我正在与Scala一起
使用
Zepplin
笔记本
,如果这有帮助的话。
浏览 5
提问于2016-03-28
得票数 0
回答已采纳
1
回答
在
Jupyter
Notebook中导入
自定义
函数
jupyter-notebook
、
data-science
我正在尝试为数据科学项目重用一些常见的
自定义
函数
。我将
函数
另存为.py文件,并在
jupyter
笔记本
中
调用它们。这些
函数
使用
了一些模块,
如
seaborn、matplotlib,我已经在
jupyter
笔记本
中导入了这些模块。然而,当我调用这个
函数
时,它抛出了一个错误,没有找到这些模块。这可能是一个非常基本的问题,但是有没有一种方法可以让
函数
看到已经导入到我的
浏览 47
提问于2020-12-19
得票数 1
1
回答
由HBase支持的
EMR
读取副本无法通过Java连接
amazon-web-services
、
amazon-s3
、
hbase
、
amazon-emr
、
geomesa
问题介绍由于: org.apache.hadoop.hbase.NotServingRegionException: org.apache.hadoop.hbase.NotServingRegionException`我能够成功地连接读写
集群
.问题只
浏览 2
提问于2020-03-27
得票数 2
2
回答
jupyter
notebook的
自定义
css文件
jupyter
、
jupyterhub
我想在jupyterHub
中
为我的
jupyter
笔记本
使用
自定义
的.css样式文件。我将custom.css文件放在~.
jupyter
/custom/custom.css和/opt/conda/lib/python3.6/site-packages/notebook/static/custom
中
,但它们都不起作用。你知道如
何在
使用
Doc
浏览 2
提问于2019-02-09
得票数 1
1
回答
AWS IAM
用户
角色或策略自包含
amazon-web-services
、
aws-sdk
、
amazon-iam
我想在IAM
中
创建一个
用户
,它基本上可以对该
用户
自己创建的资源执行任何操作(创建、修改、删除)。我有一种感觉,这可以在政策文件
中
的条件下实现,但不确定具体
浏览 5
提问于2016-04-29
得票数 2
1
回答
EMR
_EC2_DefaultRole和
EMR
_DefaultRole有什么不同?
amazon-web-services
、
amazon-emr
在aws
emr
启动后,我注意到它有一个ec2实例配置文件
EMR
_EC2_DefaultRole和一个
emr
角色
EMR
_DefaultRole,它们具有类似的权限,那么
EMR
_EC2_DefaultRole和
EMR
_DefaultRole之间有什么不同呢?
浏览 0
提问于2019-01-10
得票数 11
回答已采纳
2
回答
如
何在
EMR
上安装软件包
python
、
amazon-web-services
、
emr
、
amazon-emr
我在亚马逊网络服务上创建了一个
集群
,并安装了
Jupyter
和python3。现在我可以在单元格
中
输入代码,我发现安装了'numpy‘,即通过import numpy as np,我能够访问这个包
中
的
函数
。然而,我发现pandas不在那里。因此,在下一个单元格
中
,我输入了!af55e7023913> in <module>()----> 1 import pandas as pd ImportError: No module named 'pa
浏览 2
提问于2017-04-14
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券