在Java语言中将模式添加到Dataset[Row]

、

spark Cassandra连接器https://spark.apache.org/docs/2.2.0/structured-streaming-kafka-integration.html的文档 Dataset<Row> df = spark.format("kafka") .option("kafka.bootstrap.servers", "host1:port1,host2如何在其上应用模式</em

浏览 17提问于2019-04-12得票数 0

2回答

如何在Java中将DataFrame转换为Dataset？

、、、

我可以很容易地在Scala中将DataFrame转换为Dataset：val df = ctx.read.json("/tmp/persons.json")ds.printSchemaDataFrame df = ctx.rea

浏览 9提问于2016-01-07得票数 16

回答已采纳

2回答

火花流在java中将Dataset<Row>转换为Dataset<CustomObject>

、、、、

在这样做的时候，我遇到了一个问题，因为流是基于SQL的，而cassandra连接器是在rdd上的(这里我可能错了，请纠正我)，我很难做到这一点。下面是代码StructType getSchema(){ new<Row>, Long>() { public void call(Data

浏览 3提问于2020-06-30得票数 2

回答已采纳

1回答

[ spark -cassandra-connector]如何在spark 2.3.1中将scala隐式支持的代码转换为java

、、、

我正在尝试将spark-cassandra使用的项目从scala_2.11重构为java_1.8。现在我正在尝试将代码重构到java 1.8中。我有一些隐含和DataFrame被使用。._import org.apache.spark.sql.DataFrame 现在如何将它们转换成等价的java代码呢？有样品吗？DataFrame的导入不被识别/定义，在Scala2.11上工作得很好，现在它不能工作... 我在这里做错了什么？如何修复它？

浏览 7提问于2019-04-17得票数 0

回答已采纳

1回答

在数据集Apache Spark上应用转换

、、

我正在使用Java语言处理Apache Spark中的Dataset<Row>，需要对此Dataset中的所有列进行一些数学转换。基本上，其中一个转换是获取存储在此数据集中的所有值的日志，并仍然返回Dataset<Row>。我清楚地知道如何在RDD中的map函数中执行此操作，但是如何在Dataset<Row>中执行此操作上下文：Dataset<Row>

浏览 0提问于2017-01-04得票数 1

2回答

星火中的DataFrame是什么数据结构？

、

Row是一组有序的键值对。DataFrame是Rows的集合。 DataFrame实际上是什么数据结构？它是一个列表、集合还是其他“集合”？它和SQL一样是一个relation吗？

浏览 9提问于2017-09-28得票数 0

回答已采纳

1回答

把一天中的时间放在"x“轴上

、、、

图像0-24在几小时内是怎样的？谢谢你们所有人。

浏览 3提问于2014-12-27得票数 0

回答已采纳

1回答

将列转换为spark中的时间戳

、、

如何在Spark中将其转换为时间戳？下面是代码 package sample.spark.com; import java.util.HashMap;import java.util.Map; import org.apache.spark.sql.Encoders; importorg.apache.spa

浏览 29提问于2021-04-07得票数 1

回答已采纳

1回答

基于现有的Dataset<Row>和添加的HashMap创建一个新的火花HashMap

、、

我有一个基于JSON-数据的Dataset<Row>。现在，我希望基于初始数据集创建一个新的Dataset<Row>，但是添加一个基于HashMap<String, String>数据类型的列，类似于 Dataset<Row> dataset2 = dataset1在创建初始数据集时添加列(withColumn)的想法将确保我希望在MapFunction中更新的列存在<

浏览 0提问于2018-04-22得票数 1

2回答

、

在我的项目中，我在应用collect_list聚合函数之后得到了一个列，它是wrappedArray格式的，我想知道是否存在将该wrappedArray转换为普通数组或列表以便可以迭代该列并在该列中逐行提取值语言：- JAVA使用Apache库dataset.groupBy( "department","salary","tag") .agg(collect_list(col("

浏览 13提问于2022-11-04得票数 0

1回答

从从套接字读取创建的数据集创建DataSet<Row> (Spark Java)

、、

在Spark Streaming中，当输入源是csv文件并且我通过套接字(Java)读取它时，将只使用一个string列创建一个Dataset<Row>，并且每行的值包含通过套接字发送的每行。当我知道每一行的格式时，例如csv行的前两个值是Strings，然后是一个integer，依此类推，是否可以声明我的模式并基于该模式创建另一个Dataset<Row>并相应地放置数据？提前谢谢你。

浏览 0提问于2020-01-22得票数 0

1回答

Java MySQL查询慢于预期

、、

我正在尝试使用Java连接到我的MySQL数据库。_1, row_2, row_3, row_4 FROM dataset where row_5 is null and row_6 is null limit 100");}表'dataset‘有500万行，并在主索引(row_1、row_2、row

浏览 5提问于2014-08-27得票数 0

1回答

将架构应用于星火库的java对象数据集

、、、

这里有一个类似的问题：Dataset<Row> rowDataset = spark.getSpark().sqlContext().createDataFrame(rowRDD, schema).toDF();Dataset<MyObj> objResult = row

浏览 1提问于2017-08-20得票数 1

回答已采纳

2回答

使用java将索引列添加到apache spark Dataset<Row>

、

Spark Dataframe :How to add a index Column : Aka Distributed Data Index 我在Apache-spark中有一个现有的数据集，我想根据索引从中选择一些行我找到了下面的方法来添加使用order by的索引： df.withColumn("index", functions.row_number().over(Window.orderBy("a column

浏览 41提问于2019-05-16得票数 2

回答已采纳

1回答

如何以编程方式读取AWS Glue Data Catalog表架构

、

CSV中的列数可能会增加，从那时起，新文件中将包含新列。当发生这种情况时，我希望检测更改并自动将该列添加到目标Redshift表中。我的计划是在源CSV文件上运行Glue Crawler。模式中的任何更改都将在Glue Data Catalog中生成表的新版本。然后，我想使用Java、.NET或其他语言以编程方式读取Glue Data Catalog中最新版本的表的表结构(列及其数据类型)，并将其与Redshift表的模式进行比较。谁能给我举一些使用Java<

浏览 10提问于2018-01-15得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在Java中将DataFrame转换为Dataset？

火花流在java中将Dataset<Row>转换为Dataset<CustomObject>

[ spark -cassandra-connector]如何在spark 2.3.1中将scala隐式支持的代码转换为java

在数据集Apache Spark上应用转换

星火中的DataFrame是什么数据结构？

把一天中的时间放在"x“轴上

将列转换为spark中的时间戳

基于现有的Dataset<Row>和添加的HashMap创建一个新的火花HashMap

原因: BIRT报告中的java.lang.OutOfMemoryError: Java* heap space*

为什么我不能导入org.apache.spark.sql.DataFrame

“无法解析符号选择”尝试在DataRowCollection中使用LINQ

Spark无法将fromTuple转换为Row和Dataframe

如何丰富流查询的数据，并将结果写入Elasticsearch？

如何将星火数据集中的wrappedArray列转换为java数组？

从从套接字读取创建的数据集创建DataSet<Row> (Spark Java)

Java MySQL查询慢于预期

将架构应用于星火库的java对象数据集

使用java将索引列添加到apache spark Dataset<Row>

如何以编程方式读取AWS Glue Data Catalog表架构

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐