我需要在Scala中创建一个新的DF并附加已有的行。我该怎么做呢？

在Scala中创建一个新的DF并附加已有的行，可以使用DataFrame的union方法来实现。首先，需要导入相关的包：

import org.apache.spark.sql.DataFrame
import org.apache.spark.sql.functions._

然后，假设已有的DataFrame为oldDF，要附加的行为newRow。可以按照以下步骤来创建新的DataFrame并附加已有的行：

将新的行转换为DataFrame，可以使用spark的createDataFrame方法，并指定列名和数据类型，例如：

val newRow = spark.createDataFrame(Seq(("value1", "value2"))).toDF("col1", "col2")

将已有的DataFrame和新的DataFrame进行合并，可以使用union方法，例如：

val newDF = oldDF.union(newRow)

最终，新的DF newDF 就包含了已有的行和附加的行。

请注意，以上代码中的spark指的是SparkSession实例，需要确保已经创建了SparkSession，并命名为spark。

关于腾讯云相关产品，推荐使用腾讯云的Apache Spark集群，通过创建Apache Spark集群，可以使用Scala进行大数据处理和分析。腾讯云Apache Spark集群产品介绍及链接如下：

腾讯云Apache Spark集群：https://cloud.tencent.com/product/emr-spark

页面内容是否对你有帮助？

有帮助

没帮助

我需要在Scala中创建一个新的DF并附加已有的行。我该怎么做呢？

、

我需要创建一个带有字符串"v“、"d”、"c“的列标题的df。我有3行： in_max =[a,b,c]weight_max = [g,h] 我想设置我的df，让它看起来像这样： "v","d", "c" a,b,"i"d,f,&qu

浏览 41提问于2019-03-16得票数 0

回答已采纳

3回答

无法将Spark SQL DataFrame写入S3

、、、、

我已经在EC2上安装了Spark2.0，我正在使用SparkSQL，使用Scala从DB2中检索记录，我想写入S3，在那里我将访问键传递给spark Context..Following，这是我的代码：val df = sqlContext.read.format("jdbc").options(Map( "url" -> , "user" -> usernmae

浏览 3提问于2016-09-01得票数 2

2回答

创建具有空/空字段值的新Dataframe

、、、

我正在从现有的Dataframe创建一个新的dataframe，但是需要在这个新的DF中添加新的列(下面代码中的“field1”)。我该怎么做呢？工作样例代码示例将不胜感激。None))

浏览 2提问于2015-08-18得票数 36

1回答

如何按特定类的数据帧进行分组

、、、

我有一个包含此模式的数据帧： |-- Agreement_A1: string (nullable = true)|--Line_A2: string (nullable = true) 我用下面的代码创建了一个新的数据帧： val df2 = df.map(row => new MapResultRequestLineAgreeme

浏览 18提问于2019-08-22得票数 0

2回答

如何在星火2中产生N秒差的随机时间戳？

、

我需要在我的DataFrame中生成一个带有随机时间戳的新列，它有几秒钟的时间。DataFrame包含10.000行。起始时间戳应该是1516364153。我试图解决以下问题：但是，所有时间戳都等于某些特定值

浏览 1提问于2018-02-10得票数 0

回答已采纳

1回答

为什么我们要统一使用GetComponent方法来访问脚本中的其他组件，难道我们就不能做一个这样的对象吗？

为什么我们必须使用GetComponent方法从脚本中访问组件？我们能用它来代替吗？P.s :我是团结的新手

浏览 1提问于2021-01-03得票数 0

1回答

是否在使用pandas iterrows()时追加新行？

、、

我在下面的代码中创建了df['var'2]并修改了df['var1']。执行完这些更改后，我想将newrow (带有df['var'2])附加到数据帧中，同时保留原始(虽然现在已更改)行(具有df['var1'])。for i, row in df.iterrows(

浏览 3提问于2016-03-08得票数 7

回答已采纳

3回答

从pandas中的每一行创建新列

、、

我正在尝试创建一个新列，并使用每行中的值填充它。我有一个专栏“旅程”，新的专栏是“起源”。if " to " in journey: else: df['Origin&#

浏览 0提问于2018-04-24得票数 3

0回答

将不同的值添加到数据帧中的不同行

要在新列下添加从第1行到第10行的值1.45和第10行的值2.55，我可以使用以下R代码执行此操作但是，我想在单列下为前N

浏览 2提问于2016-07-09得票数 0

1回答

创建下载链接，但源是Java字符串

、、、

我想创建一个下载链接，但我遇到的问题是源文件是一个Java字符串。我拥有的字符串是一个JSON数据。我希望人们能够下载这些数据。我该怎

浏览 0提问于2013-07-11得票数 0

回答已采纳

1回答

如何在org.apache.spark.sql.Row中添加mapPartitions列

、

我是scala的新手，请记住:) 先谢谢你

浏览 6提问于2015-11-23得票数 25

回答已采纳

1回答

JQuery追加到动态创建的元素

、

我动态地将一个div元素附加到一个现有的div中。但是紧接着，我需要将另一个div附加到我刚刚动态创建的div中。但是我似乎找不到动态创建的div来追加它。我假设DOM可能还没有意识到这个div，因为我刚刚创建了它。我该怎么做</e

浏览 0提问于2012-12-05得票数 5

回答已采纳

1回答

用python编辑excel文件

、、

我试图编辑一个现有的excel文件。我的文件是test.xlsx，其中两张是All和Summary。以下步骤： number_rows = len(df.index) df.to_excel(writer, sheet_name

浏览 7提问于2017-03-29得票数 3

2回答

带映射或应用的上一行中的引用值

、

给定一个dataframe df，我希望根据上一行中的值为每一行生成一个新的变量/列。df被排序，因此行的顺序是有意义的。通常，我们可以使用map或apply，但它们似乎都不允许访问上一行中的值。例如，给定现有的行a b c，我希望生成一

浏览 4提问于2014-04-28得票数 2

回答已采纳

1回答

数据帧上的循环替换(&R)

、

我需要在我的dataframe (泰坦尼克号数据集)调用范围中添加一个新列，该列包含泰坦尼克号上每个乘客的范围，如下表所示：Young 18 yearsOld 50 years 我创建了一个新列，并用NaN填充它。然后，我尝试了一个循环来遍历年龄并

浏览 0提问于2021-04-18得票数 0

1回答

创建一个具有变量名的文本文件并写入该文件

对于我正在开发的一个应用程序，我正在尝试创建一个“保存数据”功能。首先，它需要创建一个具有自定义名称的.txt文件，这需要是日期(今天)和文本框的文本，它需要是yyyymmdd_textbox1(.txt)格式我该怎么做呢？它可以在任何地方创建它，但如果它已经存在，则需要在新的行</

浏览 0提问于2017-07-06得票数 0

1回答

在intellj中调试scala的过程中，我们可以暂停一条语句，然后运行其他代码吗？

、

有时我需要在调试期间与scala控制台进行交互。我现在要做的是:编写一个带有方法的类，并让该方法返回某个对象，然后在scala控制台中，我导入该类，创建一个新实例并运行该方法以获取对象，然后与该对象进行交互操作。如果我需要修改该方法，则必须首先在IDE中进行

浏览 0提问于2014-11-09得票数 0

2回答

合并/合并Pandas，其中包含唯一行ID的列，以及具有所有ID和统一、非重复列表的DataFrame？

、、

我对Pandas非常陌生，因此我不知道是否有一种智能的、高效的方法来执行以下操作--例如，一些我不知道的merge-like操作。我希望你们中的一些人能帮忙。假设我有两个dataframes，其中每一行包含1)该dataframe独有的ID，2)由该ID持有的项的列表。(data={'id'

浏览 4提问于2022-01-19得票数 1

回答已采纳

1回答

如何在分配新任务时设置任务域？

、、、

我正在使用SharePoint designer 2013创建WF。目前，我只能在任务完成(批准或拒绝

浏览 3提问于2016-05-23得票数 0

3回答

Pandas:如何根据另一列的值创建一列？

、、

我需要在数据框的末尾创建一个新列，其中新列中的值是应用某个函数的结果，该函数的参数基于其他列。具体地说，来自另一列，但不同的行。因此，例如，如果我的数据框有两列，分别包含值x_i和y_i，则我的第三列将为f(x_(i-1), y_(i-1)) 我知道要创建一个</em

浏览 2提问于2015-09-24得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

我需要在Scala中创建一个新的DF并附加已有的行。我该怎么做呢？

相关·内容

我需要在Scala中创建一个新的DF并附加已有的行。我该怎么做呢？

无法将Spark SQL DataFrame写入S3

创建具有空/空字段值的新Dataframe

如何按特定类的数据帧进行分组

如何在星火2中产生N秒差的随机时间戳？

为什么我们要统一使用GetComponent方法来访问脚本中的其他组件，难道我们就不能做一个这样的对象吗？

是否在使用pandas iterrows()时追加新行？

从pandas中的每一行创建新列

将不同的值添加到数据帧中的不同行

创建下载链接，但源是Java字符串

如何在org.apache.spark.sql.Row中添加mapPartitions列

JQuery追加到动态创建的元素

用python编辑excel文件

带映射或应用的上一行中的引用值

数据帧上的循环替换(&R)

创建一个具有变量名的文本文件并写入该文件

在intellj中调试scala的过程中，我们可以暂停一条语句，然后运行其他代码吗？

合并/合并Pandas，其中包含唯一行ID的列，以及具有所有ID和统一、非重复列表的DataFrame？

如何在分配新任务时设置任务域？

Pandas:如何根据另一列的值创建一列？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐