试图从Spark (crealytics)读取excel文件，但看不到数据

、、、

1)我正在尝试读取第一个excel文件，使用 dataAddress = dataAdd,**maxRowsInMemoryignoreTrailingWhiteSpace", "true") .load(dataFilePath) 由于启用了maxRowInMemor

浏览 38提问于2020-05-05得票数 0

2回答

如何使用pyspark读取Excel文件？

、、、、

我正在尝试使用AWS EMR的Pyspark来读取它驻留在s3中的Excel文件，为此，我下载了spark-excel jars spark-excel_2.11-0.12.4.jar和spark-excel_2.12-0.13.5.jar，并将其放入s3存储桶中=========== df = spark.read.format("com.crealytics.

浏览 109提问于2021-02-13得票数 0

1回答

如何将excel读入电火花数据

、、、、

我能够读取所有的文件和格式，如csv，拼花，三角洲从adls2帐户与oauth2信用。但是，当我试图像下面这样读取excel文件时，.option("header", "true") \ .option("inferSc

浏览 3提问于2021-08-02得票数 0

1回答

我试图使用Crealytics从HDFS位置读取一个Excel文件，并不断得到一个错误(由: java.lang.ClassNotFoundException:org.apache.spark.sql.connector.catalog.TableProvider当运行下面的代码时，火花会话启动罚款，Crealytics包加载，没有错误。只有在运行"spark.read“代码时才会出现错误。我使用的文件位置

浏览 11提问于2022-02-28得票数 -1

回答已采纳

1回答

无法从azure blob存储容器中读取xlsx文件到pyspark数据帧

、、、、

我正在尝试将数据从Azure存储容器加载到Azure Databricks中的Pyspark数据框架。当我读取txt或CSV文件时，它正在工作。但是，当我试图读取.xlsx文件时，我会得到以下问题。:31)at com.crealytics

浏览 11提问于2022-05-12得票数 0

1回答

跳过Databricks上的前导行-从ADLS 1读取-需要其他选项或解决方案来解决我的具体情况

、

我正在尝试从ADLS Gen 1存储文件夹中读取数据，并尝试写入ADLS 1。我有Databricks代码，它使用spark_excel从ADLS 1读取excel文件。spark_df = spark.read.format("com.crealytics.spark.excel").option(&qu

浏览 5提问于2022-08-17得票数 0

1回答

如何使用中的hadoop office库将数据集写入excel文件

、、、

目前，我使用com.crealytics.spark.excel读取Excel文件，但使用此库，无法将数据集写入Excel文件。这个说，使用hadoop库(org.zuinnote.spark.office.excel)，我们可以读写Excel文件请帮助我在spark .中将数据集对象写入excel<

浏览 5提问于2017-06-28得票数 4

回答已采纳

2回答

从ADLS存储中读取Excel文件为

、、、

我们尝试以下列方式读取excel文件：收到一个错误声明：

浏览 12提问于2022-10-11得票数 0

回答已采纳

2回答

如何在spark中编写dataset对象以excel？

、、、

我使用com.crealytics.spark.excel软件包读取excel文件。下面是在spark中读取excel文件的代码。Dataset<Row> SourcePropertSet = sqlContext.read() .format("com.crealytics.spark.excel"&

浏览 5提问于2017-06-24得票数 2

回答已采纳

2回答

如何使用火花加载excel表？

、

用excel工作表创建数据格式的代码。 df = spark.read.load("examples/src/main/resources/people.xls", format="xls")

浏览 9提问于2020-03-03得票数 0

2回答

读入火花放电中的Excel* (.xlsx)文件*

、、

我正在尝试从.xlsx的本地路径读取PySpark文件。我编写了以下代码：from pyspark.sql import SparkSession .master('local') \ .enableHiveSupport() \ .config(

浏览 8提问于2020-01-22得票数 8

回答已采纳

2回答

使用从excel文件中加载数据

、、、、

我希望使用Session 2.2从HDFS中的Excel文件中加载数据。下面是我的Java代码和我得到的异常。format("com.crealytics.spark.excel").我有个例外： com.crealytics.spark.excel.Excel

浏览 4提问于2018-05-02得票数 0

回答已采纳

2回答

用apache读取excel文件

、、、

(阿帕奇星火公司的新产品) at com.crealytics.spark.excel.WorkbookReader$.apply(WorkbookReader.scala:38) at com.crealytics.spark.<e

浏览 8提问于2020-07-08得票数 0

回答已采纳

1回答

读取excel时Spark出错: org.apache.poi.openxml4j.exceptions.InvalidFormatException

、

我试图读取一个excel文件使用Spark CLI，但我得到你的InputStream既不是一个OLE2流，也不是一个OOXML流“错误。下面是我的excel表格中显示的数据： Id Name City2 Sharma Mumbai4 AbhayDelhi 5 Rohit Gurgaon 下面是我使用的代码： import com.crealytics</

浏览 79提问于2019-04-02得票数 0

1回答

使用com.crealytics检测到的fs.azure.account.key配置值无效:spark

、、、、

我已经设置了我的数据库笔记本使用服务主体访问ADLS使用以下配置。读取csv文件，但是用excel文件获取Invalid configuration value detected for fs.azure.account.key。下面是读取excel文件的代码。#libaray used com.crealytics:spark-excel_2.12:3.2.2_0.18.0 df = s

浏览 16提问于2022-09-27得票数 1

回答已采纳

1回答

在spark* 2.0.0中以流式方式读取excel文件*

、、、

我有一组Excel格式文件，需要在将Excel文件加载到本地目录时从Spark(2.0.0)读取。这里使用的Scala版本是2.11.8。我能够静态地读取Excel文件如下： val df = spark.read.format("com.crealytics.spark.excel").option("sheetN

浏览 5提问于2017-09-12得票数 1

5回答

如何将xlsx或xls文件作为spark* dataframe读取*

、、

有没有人可以在不转换xlsx或xls文件的情况下让我知道，我们如何才能将它们作为spark数据帧读取？我已经尝试使用pandas读取数据，然后尝试转换为spark dataframe，但得到错误，错误是Cannot merge type <class 'pyspark.sql.types.DoubleType'> and <class 'pyspark.sql.types.StringType&

浏览 25提问于2019-06-03得票数 8

2回答

星星之火-excel数据问题

、、、、

我正在使用包处理ms文件使用火花2.2。除了下面的例外情况外，有些文件无法作为火花数据文件加载。如果有人遇到这个问题，你能帮我解决这些数据类型问题吗？在分析之后，我发现如果列名不是字符串，它最终会给出下面的异常，如果我手动将列名从整数更改为字符串，它就会工作得很好。 val excelDF = spark.read.format("com.crealytics.spark.excel"

浏览 3提问于2018-01-17得票数 2

5回答

如何从Spark中的Excel* (xls，xlsx)文件构造Dataframe？*

、、、、

我有一个包含多个工作表的大型Excel(xlsx and xls)文件，我需要将它转换为RDD或Dataframe，以便以后可以将它加入到其他dataframe。我正在考虑使用并将其保存为CSV，然后在dataframe中读取csv。但是，如果有任何库或API可以在这个过程中提供帮助，那就很容易了。任何帮助都是非常感谢的。

浏览 12提问于2017-05-26得票数 17

回答已采纳

2回答

spark.read.excel -使用自定义架构时不读取所有Excel行

、、、、

我正在尝试从一个'excel‘文件中读取一个火花DataFrame。我利用了克赖克主义的依赖性。"com.crealytics" %% "spark-

浏览 6提问于2021-12-31得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用pyspark读取Excel文件？

如何将excel读入电火花数据

使用Crealytics包读取Excel文件时出错

无法从azure blob存储容器中读取xlsx文件到pyspark数据帧

跳过Databricks上的前导行-从ADLS 1读取-需要其他选项或解决方案来解决我的具体情况

如何使用中的hadoop office库将数据集写入excel文件

从ADLS存储中读取Excel文件为

如何在spark中编写dataset对象以excel？

如何使用火花加载excel表？

读入火花放电中的Excel* (.xlsx)文件*

使用从excel文件中加载数据

用apache读取excel文件

读取excel时Spark出错: org.apache.poi.openxml4j.exceptions.InvalidFormatException

使用com.crealytics检测到的fs.azure.account.key配置值无效:spark

在spark* 2.0.0中以流式方式读取excel文件*

如何将xlsx或xls文件作为spark* dataframe读取*

星星之火-excel数据问题

如何从Spark中的Excel* (xls，xlsx)文件构造Dataframe？*

spark.read.excel -使用自定义架构时不读取所有Excel行

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐