腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
4
回答
在
Scala
IDE
中
读取
spark
代码
中
的
avro
文件
时
出错
、
、
、
我通过
读取
avro
文件
创建了一个数据框,但在
scala
IDE
的
spark
应用程序
中
读取
该
文件
时
出现错误。: org.apache.
spark
.sql.
avro
.AvroFileFormat。请在上查找软件包SparkCourseAsMavenProject构建路径
的
spar
浏览 22
提问于2020-05-28
得票数 0
2
回答
如何在
Spark
2.4
中
读取
闪烁2-shell
中
的
Avro
文件
?
、
我们
在
Spark
2.4
中
在
spark
2-shell
中
读取
avro
文件
时
遇到了问题,任何指针都会有很大帮助。我们使用以下方法
读取
Spark
2.4 2.3
中
的
avro
文件
,但这种支持
在
Spark
2.4
中
已被删除:
spark
2-shell --
浏览 4
提问于2020-01-24
得票数 2
回答已采纳
2
回答
解决星星之火-
avro
=未能加载数据源类: com.databricks.
spark
.
avro
、
、
、
我正在尝试使用库来处理
avro
文件
。" %% "
spark
-
avro
" % "1.0.0")import org.apache.
spark
.SparkContext }当我
在
浏览 3
提问于2015-05-13
得票数 0
回答已采纳
2
回答
Spark
读取
Avro
文件
、
、
、
我使用
的
是com.databricks.
spark
.
avro
。当我
在
spark
-shell
中
运行它
时
,就像这样:
spark
-shell --jar
spark
-
avro
_2.11-4.0.0.jar,我可以通过这样
的
方式
读取
文件
: import org.apache.
spark
.sql.SQLContextclean run
在
我
浏览 117
提问于2018-12-11
得票数 1
回答已采纳
1
回答
如何将拼花
文件
转换成
Avro
文件
?
、
、
、
我是hadoop和大数据技术
的
新手。我喜欢将拼花
文件
转换为
avro
文件
并
读取
数据。我
在
几个论坛上搜索,它建议使用AvroParquetReader。我可以使用shell
读取
这个
文件
,并可能将其转换为一些JSON,然后将该JSON转换为
avro
。但我正在寻找一个更简单
的
解决方案。
浏览 0
提问于2016-12-23
得票数 3
1
回答
AVRO
文件
上
的
Hive外部表只为所有列生成空数据
、
、
、
、
我试图
在
一些使用Hive external table生成
的
avro
文件
的
基础上创建一个
spark
-
scala
。我使用
的
是CDH 5.16,它有hive 1.1,
spark
1.6。 同时,当我使用
avro
作为
spark
-
scala
读取
这些dataframe
文件
并打印它们
时
,我得到了正确
的
结果。下面是我
浏览 1
提问于2019-07-17
得票数 2
回答已采纳
1
回答
Kafka Connect JDBC : Oracle NUMBER字段
的
精度为64,无法从火花
读取
、
、
、
、
我们使用Kafka从Oracle数据源
中
摄取数据,并以
AVRO
格式写入HDFS。
在
Kafka模式注册表
中
,其中一个数据源
的
模式如下所示: "type": "record", "namespace": "io.confluent.connect.
avro
当我尝试这些
AVRO
文件
<
浏览 4
提问于2019-10-23
得票数 0
1
回答
从
avro
文件
中
获取火花dataframe列
中
每一行
的
数据
、
、
我正在尝试处理我
的
dataframe
中
的
一个列,并从每个条目对应
的
avro
文件
中
检索一个度量。基本上,我想做以下几点:
读取
路径列
的
每一行,这是作为数据
读取
到
avro
文件
中
的
avro
文件
的
路径&获取精度度量,它以Struct
的
形式创建一个名为
的
新列,
浏览 4
提问于2022-07-01
得票数 0
1
回答
星火2.4 com.databricks.
spark
.
avro
故障排除
、
、
、
当我用
spark
2.2.0提交它
时
,它工作得很好,但是当我用版本2.4.0提交它
时
,它却没有启动。只有
SPARK
_HOME才能带来不同
的
结果。顺便说一句: jar是以dependency 2.1作为依赖关系构建
的
。有什么想法吗? 编辑:,我认为我
的
问题是,而不是,它与
在
uberjar
中
查找东西
的
火花有关。更确切地说,我可能对
在
avro
中
内置
的
新
浏览 2
提问于2019-01-28
得票数 1
1
回答
如何允许火花忽略丢失
的
输入
文件
?
、
我想在一些包含
avro
文件
的
生成
的
S3路径上运行一个火花作业(Sparkv1.5.1)。我给他们装了:然而,其中一些路径将不存在。我怎么能让火花忽略那些空旷
的
道路?以前我使用过,但是我不知道如何在新
的
dataframe中使用它。 注意:理想情况下,我正在寻找一种类似于链接答案
的
方法,这种方法只是使输入路径成为可选
的
。我并不特
浏览 2
提问于2015-11-10
得票数 14
回答已采纳
1
回答
PySpark无法从Pycharm
读取
本地
Avro
文件
、
我有一个示例
avro
文件
,并运行一个基本
的
spark
应用程序来
读取
它: .builder \ .getOrCreate() .format("org.apache.
spark
.sql.
avro
.AvroFileFormat&
浏览 1
提问于2021-11-03
得票数 1
1
回答
Scala
:
读取
火花结构化流
中
的
Kafka
Avro
消息
时
出错
、
、
、
、
我一直
在
尝试阅读Kafka
的
avro
串行化消息,这些消息来自于
Scala
2.11
的
火花结构化流(2.4.4)。为此,我使用了星星之火-
avro
(下面的依赖性)。我准备了一个简单
的
例子来说明这个问题,这里
的
代码
是可维护
的
:{ &q
浏览 0
提问于2020-02-29
得票数 2
回答已采纳
2
回答
Avro
模式引发StructType
、
、
、
这实际上与我
的
相同,但使用
Avro
而不是JSON作为数据格式。我正在使用一个
Spark
dataframe,它可以从几个不同
的
模式版本中加载数据:{"namespace": "com.example.
avro
", .format("com.databricks.
spark
.
avro
浏览 1
提问于2015-11-25
得票数 7
1
回答
如何在加载源Java类
时
使用
Spark
shell
读取
Avro
文件
(从Java类生成)?
、
、
我得到了几个
Avro
文件
,它们是从java类A
的
对象生成
的
。使用
spark
-shell (
Spark
1.4.0),我可以使用
spark
-
avro
(2.0.1版)将这些
文件
读取
到数据帧
中
。val df = sqlContext.read.
avro
("file.
avro
") 只要
spark
shell不知道类A,就可以正常工作
浏览 1
提问于2015-09-10
得票数 1
1
回答
spark
Scala
读取
Avro
并保存
、
我使用下面的
代码
在
spark
scala
中
读取
avro
文件
。val buf =
scala
.collection.mutable.ListBuffer.empty[GenericRecord] } 我想将此输出保存在文本
文件
中
。
浏览 2
提问于2017-09-21
得票数 1
1
回答
错误:对象xml不是包com.databricks.
spark
的
成员。
、
、
、
、
我正在尝试使用SBT
读取
XML
文件
,但是我在编译它
时
遇到了问题。" % "2.0.0"libraryDependencies+= "org.
scala
-lang.modules" %% "
scala
-xml&qu
浏览 6
提问于2017-09-22
得票数 0
回答已采纳
2
回答
emr中用
spark
从S3
中
读取
avro
的
失败
、
、
、
、
在
aws上执行我
的
Spark
作业
时
,
在
尝试从s3桶
读取
avro
文件
时
出现了这个错误:它发生在版本
中
: val files =("com.databricks.
spark
.
avro
").load(files: _*)java.lang.IllegalArg
浏览 3
提问于2017-10-16
得票数 0
1
回答
如何向hdinsight添加databricks
avro
jar
、
、
、
、
我目前正试图
在
我们
的
HDInsight集群上运行一个
Scala
作业,它
的
外部库星星之火--
avro
没有成功。有人能帮我解决这个问题吗?目标是找到必要
的
步骤,以便能够
读取
驻留在HDInsight集群上Azure blob存储区上
的
avro
文件
。当前规范:
spark
-ass
浏览 1
提问于2017-04-04
得票数 0
回答已采纳
2
回答
Spark
2.4.1无法从HDFS
读取
Avro
文件
、
、
、
、
我有一个简单
的
代码
块来编写,然后将数据
读取
为
Avro
格式。由于
Avro
lib已经构建在
Spark
2.4.x
中
,
Avro
文件
写入成功,
在
HDFS中生成
文件
。但是,当我
读取
文件
时
,会引发AbstractMethodError异常。有人能和我分享点光吗?我
在
我
的
Zeppelin节点簿
Spark
浏览 2
提问于2019-06-10
得票数 1
回答已采纳
4
回答
由于AbstractMethodError,
spark
scala
avro
写入失败
、
我正在尝试从
avro
读取
数据,按字段重新划分数据并将其保存为
avro
格式。下面是我
的
示例
代码
。
在
调试过程
中
,我不能在我
的
数据帧上显示(10)。它会失败,并显示以下错误。有没有人能帮我弄明白我
在
代码
行
中
做错了什么?
代码
: val df =
spark
.read
浏览 40
提问于2019-11-27
得票数 0
点击加载更多
相关
资讯
Apache Spark 2.4 内置的 Avro 数据源实战
在Python程序中读取和写入文件的方法
Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器
Spark 2.4 原生支持了avro,别再引用第三方库了
使用Spark将本地文件读取并封装为DataFrame的完整指南
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券