Spark -为什么ArrayBuffer似乎获得了尚未遍历的元素

Spark是一个开源的分布式计算框架，用于处理大规模数据集的计算任务。它提供了高效的数据处理能力和易于使用的编程接口，可以在大规模集群上进行并行计算。

ArrayBuffer是Scala语言中的一个可变数组数据结构，它可以动态地增加或删除元素。在Spark中，ArrayBuffer可以用来存储和操作数据集的元素。

当我们使用ArrayBuffer时，有时会遇到似乎获得了尚未遍历的元素的情况。这可能是由于Spark的惰性求值特性所导致的。Spark采用了惰性求值的策略，即在遇到需要触发计算的操作之前，它不会立即执行计算，而是将计算过程记录下来，等到需要结果时才进行实际的计算。

在遍历ArrayBuffer时，如果我们对其进行了一些转换操作（如map、filter等），这些操作并不会立即执行，而是返回一个新的转换后的数据集。因此，当我们访问ArrayBuffer中的元素时，可能会看到尚未遍历的元素，因为这些元素在转换操作之后才会被计算出来。

为了确保获取到完整的遍历结果，我们可以使用一些触发计算的操作，如collect、count等。这些操作会强制Spark执行计算，并返回计算结果。

总结起来，ArrayBuffer似乎获得了尚未遍历的元素是由于Spark的惰性求值特性所导致的。为了获取完整的遍历结果，我们可以使用触发计算的操作。

Spark -为什么ArrayBuffer似乎获得了尚未遍历的元素

、

为什么MapPartition中的ArrayBuffer似乎有它还没有遍历的元素？[2,2,A

浏览 18提问于2017-12-28得票数 0

1回答

从scala中的for循环向ArrayBuffer中添加元素

、

import scala.collection.mutable.ArrayBuffer spark.sql("set table=member_test") var tempArray = new ArrayBuffer[String](我尝试遍历一个数据帧并将格式化

浏览 72提问于2020-09-15得票数 0

回答已采纳

1回答

POSTing封装在对象中的ArrayBuffer

、、、

我编写了一些AJAX，它获得了一个文件客户端，这样我就可以将它发回服务器。被反对的对象被取为ArrayBuffer。但是，当将这个二进制文件发回服务器保存时，我需要在这个文件中包含一些元数据。我尝试过用其他字符串和对象包装ArrayBuffer，但是当我检查数据服务器端时，它似乎只传输了ArrayBuffer的长度。。然而，我的ArrayBuffer

浏览 2提问于2012-11-26得票数 0

1回答

过滤带有空属性的XML元素

、

我试图从常规XML结构中提取属性；首先排除缺少特定属性的元素似乎是很自然的。我不知道为什么以下内容不起作用(请看为什么我有了测试和null的想法)： val test = <top><el attr="1"></el><el></el><el attr="2"></el></top= null).map

浏览 5提问于2017-07-26得票数 2

回答已采纳

1回答

Scala无限环

、、

因此，我对scala很陌生，从我在网上发现的情况来看，scala不像其他语言那样更新变量。我试图在while循环中更改一个变量，但它似乎没有改变。我有一个可变的ArrayBuffer，它保存着键、值对，声明如下：它根据"K通过执行以下操作，我试图遍历array1的各个层：var counter = 0 while(ar

浏览 2提问于2021-11-12得票数 0

回答已采纳

1回答

Spark Graphx:每轮时间成本以线性方式稳定增加

、

虽然.每轮的时间成本似乎仍呈线性增长趋势。我的代码的简化版本如下，它得到了同样的问题：import org.apache.spark.graphx.Graphimport org.apache

浏览 2提问于2016-06-22得票数 0

1回答

Spark抛出UTF8字符串转换错误

、

Spark窗口函数似乎不能正常工作。我看到在原始数据中有一些记录具有相同的data_rfe_id和相同的seq_id，因此，我使用row_number函数使用窗口函数来过滤row_num === 1的记录。为什么会发生这种事？它只对某些任务抛出下面的异常，而在4次重复失败的任务之后作业失败？当我在Spark中运

浏览 2提问于2017-10-01得票数 5

1回答

将S3中的地块文件映射到其方案以求解配置单元ClassCastException

、、、、

与Scala和org.apache.spark.sql.functions的input_file_name函数一起使用，并将其封装在一个自定义函数中。sqlContext.read.parquet(lines.toString.replace("[","").replace("]","")).schema.toString)}) 它只是给出了一个RDD(字符串，字符串)，似乎在我的地图中读取拼图的部分会产生一个$plus$pl

浏览 17提问于2019-03-22得票数 0

回答已采纳

1回答

迭代后火花阵列为空

、、

在Spark1.6.0中(我不太熟悉spark和scala)，当我迭代一个集合并在迭代结束时将项添加到数组中时，该数组似乎是空的。') (line, htf.transform(text))var hi

浏览 0提问于2016-10-11得票数 0

回答已采纳

1回答

Google上的IllegalStateException

、、

$plus$plus$eq(ArrayBuffer.scala:104) at scala.collection.mutable.ArrayBuffer.下一步是从RDD中提取JSON元素，然后将其读入表中，我们可以进行查询。现在的问题是，Spark发现的JSON文件比应该找到

浏览 3提问于2017-09-25得票数 1

回答已采纳

1回答

jQuery:遍历两个ID内的所有元素

、、

我尝试遍历两个.required中的每个div：#A和#B。$('#A .required').nextUntil('#B').each(function() {}); 上面的代码似乎只获得了两个div中的最后一个元素。

浏览 0提问于2011-10-16得票数 0

回答已采纳

1回答

scala.collection.mutable.WrappedArray$ofRef不能强制转换为整数

、、

我是Spark和Scala的新手。我试图调用一个函数作为Spark UDF，但我遇到了这个错误，我似乎无法解决。我知道在Scala中，Array和Seq是不同的。WrappedArray是Seq的一个子类型，并且在WrappedArray和数组之间存在隐式转换，但我不确定为什么在使用自定义函数的情况下不会发生这种转换。任何能帮助我理解和解决这个问题的建议都是非常感谢的。"k“上的操作失败

浏览 0提问于2016-10-23得票数 23

回答已采纳

1回答

单击按钮后，如何遍历DOM以获取特定元素

我很难理解如何正确地利用.close()来遍历DOM并对特定元素进行更改。我正在尝试通过.close()来实现这一点，但尚未取得任何成功。它似乎没有像我期望的那样遍历DOM。这就是我一直在尝试但没有用的东西。function(event){ }) 我想我的</e

浏览 20提问于2019-04-19得票数 0

回答已采纳

1回答

如何检查控件是否已加载？

、、

如果在加载控件后使用SetCameraCount设置为，则控件应该以与第一次使用新的cameraCount值加载时相同的方式更新。虽然它运行良好，但我想知道是否可以用一些已经在Windows中实现的属性来替换_IsLoaded bool。现在我什么也没找到。你知道这样的财产吗？

浏览 2提问于2013-05-22得票数 1

回答已采纳

7回答

在JavaScript中查找元素所属的表单

、、

如何使用简单/少量的JavaScript找出包含HTML元素的表单？在下面的示例中，如果我已经获得了名为“message”的跨度，我如何才能轻松地访问表单元素？name="whatever"> <span id="message"></span></form> 跨度可能嵌套在其他表或D

浏览 11提问于2009-01-21得票数 13

回答已采纳

2回答

绑定到Ajax并遍历通过Ajax交付的内容

、

我不知道如何绑定到通过Ajax加载的内容，并遍历它以查看是否添加了任何新元素。，但我不知道如何绑定遍历。我尝试过使用$(document).on('ajaxStop')，然后遍历，但这似乎对我不起作用。我不能使用.on('click')或其他任何类似的事件，因为新的内容还没有加载。有什么办法吗？上面的代码对于页面上已经存在的内容非常有用，所以我只需要修改它，以便将它绑定到未来的.my-sele

浏览 0提问于2012-03-27得票数 0

回答已采纳

3回答

Scala Apache Spark中DStream的输出内容

、

下面的Spark代码似乎不会对文件example.txt执行任何操作 .setMaster("local")10个元素15/03/12 12:23:53 INFO JobScheduler: Started JobScheduler 15/03/12 12:23:54 INFO FileInputDStreamRDD的

浏览 4提问于2015-03-12得票数 4

回答已采纳

2回答

为什么Scala的toSeq会将不可变的集合转换为可变的ArrayBuffer？

、、、、

如果我在一个不可变的Set集合上调用toSeq，我会得到一个ArrayBuffer。scala> Set(1,2,3).toSeq // returns Seq[Int] = ArrayBuffer(1, 2, 3) 这让我很惊讶。鉴于Scala强调使用不可变的数据结构，我希望得到一个不可变的序列，比如Vector或List，而不是可变的ArrayBuffer。set元素的返回顺序当然应该是未定义的<

浏览 0提问于2012-12-04得票数 19

回答已采纳

1回答

如何有效地计算数组的索引，在Scala中，累积和超过了阈值？

、、、

我希望找到数组的索引(比如k)，其中第一个k+1元素的累积和大于某一阈值，但是对于第一个k元素则较少。我正在使用Scala2.10.6和Spark1.6.0我认为这种方法是解决我的问题的好办法，但现在我认为我走错了路。我的实际问题是：我有一堆JSON-s，这些JSON-s作为RDD加载到Spark中。我的想法是逐个遍历RDD，计算JSON的大小并将其添加到累加器中。当累

浏览 1提问于2017-06-21得票数 1

3回答

在Scala中检查两个Spark* DataFrames是否相等*

、、、

我是Scala的新手，在编写单元测试时遇到了问题。我正在尝试在Scala中比较和检查两个Spark DataFrames单元测试的相等性，并意识到没有简单的方法来检查两个Spark DataFrames的相等性。= result[row][col]) return false; } 实际的测试将涉及基于DataFrames列的数据类型的相等性测试(使用浮点数的精度、容差等进行测试)。<em

浏览 3提问于2016-11-09得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Spark -为什么ArrayBuffer似乎获得了尚未遍历的元素

相关·内容

Spark -为什么ArrayBuffer似乎获得了尚未遍历的元素

从scala中的for循环向ArrayBuffer中添加元素

POSTing封装在对象中的ArrayBuffer

过滤带有空属性的XML元素

Scala无限环

Spark Graphx:每轮时间成本以线性方式稳定增加

Spark抛出UTF8字符串转换错误

将S3中的地块文件映射到其方案以求解配置单元ClassCastException

迭代后火花阵列为空

Google上的IllegalStateException

jQuery:遍历两个ID内的所有元素

scala.collection.mutable.WrappedArray$ofRef不能强制转换为整数

单击按钮后，如何遍历DOM以获取特定元素

如何检查控件是否已加载？

在JavaScript中查找元素所属的表单

绑定到Ajax并遍历通过Ajax交付的内容

Scala Apache Spark中DStream的输出内容

为什么Scala的toSeq会将不可变的集合转换为可变的ArrayBuffer？

如何有效地计算数组的索引，在Scala中，累积和超过了阈值？

在Scala中检查两个Spark* DataFrames是否相等*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐