Scala、Spring或Hadoop作为Api服务？

文章/答案/技术大牛

发布

1回答

、

DOCTYPE html>";我对使用Scala、Spring或Hadoop重新构建应用程序很感兴趣-非常热衷于通过链接和教程来讨论这一点，以帮助开发快速而安全的api。因此，我热衷于使用reactjs构建前端-并让Java应用程序提供API服务。我预测，启动一个新的Scala、

浏览 14提问于2017-08-24得票数 0

1回答

我正在尝试从Spark在集群模式下执行的scala脚本内部执行一个特定于HDFS的命令。scala> val cmd = Seq("hdfs","dfs","-copyToLocal","/tmp/file_landing_area/file.dat","/tmp/local_file_areaSeq[String] = List(hdfs, dfs, -copyToLocal, /tmp/fi

浏览 60提问于2019-06-03得票数 1

1回答

在web应用程序中使用apache作为缓存

、、、

我有一项任务要在我的webapp中使用Spark作为Cache，我查看了它文档中共享的示例java代码，并能够独立运行它。但是当我在我的webapp (在servlet init()中)中初始化它时，也尝试在spring上下文中初始化它，但是不管是哪种方式，它都失败了。我正在使用ApacheSpark1.1.0使用Hadoop2.4的预构建包(火花-程序集- 1.1.0 -hadoop2.4.0.jar)init() { System.out.printlnOffending class

浏览 1提问于2014-11-11得票数 1

回答已采纳

1回答

为什么新作业()抛出java.lang.IllegalStateException:作业处于状态定义而不是运行？

、

我跟随作为模板。本文中的代码使用作业设置来调用ParquetOutputFormat API的方法。scala> import org.apache.hadoop.mapreduce.Job java.lang.IllegalStateException: Job in state DEFINE instead of RUNNING at org.apache.hadoop.mapreduce.Job.ensu

浏览 0提问于2014-12-19得票数 5

回答已采纳

2回答

AWS EMR火花“无模块命名火花放电”

、、、

我创建了一个星星体集群，ssh进入主服务器，并启动shell： org.apache.spark.api.python.PythonWorkerFactory.createThroughDaemon(PythonWorkerFactory.scala:78) org.apache.spark.api.python.PythonWorkerFactory.create(Py

浏览 0提问于2014-11-13得票数 1

回答已采纳

1回答

在Dataproc上使用Spark访问跨帐户GCS

、、、、

我尝试将GOOGLE_APPLICATION_CREDENTIALS设置为服务帐户密钥文件，该文件允许访问帐户A中的必要桶。但是，如果启动spark-shell，则会出现以下错误。by: at com.google.cloud.hadoop<

浏览 1提问于2019-08-11得票数 5

1回答

如何使用apache-spark引导读取CSV文件

、、、、

(Shell.java:547) ~[hadoop-client-api-3.3.2.jar:na] at org.apache.hadoop.util.Shell.getQualifiedBin(Shell.java:591) ~[hadoop-client

浏览 18提问于2022-10-10得票数 0

回答已采纳

1回答

星星之火/Hadoop/Yarn集群通信需要外部ip？

、、、

我使用bdutil在Hadoop (2.6)集群上部署了Spark (1.3.1)和spark，默认情况下，这些实例是用短暂的外部ips创建的，到目前为止火花工作得很好。出于一些安全方面的考虑，假设集群仅被内部访问，我从实例中删除了外部ips；之后，星火外壳甚至无法运行，似乎无法与Yarn/Hadoop通信，只是无限期地停留在其中。

浏览 2提问于2015-06-26得票数 0

回答已采纳

1回答

在google云实例上运行Spark时出错

、、、

我正在使用Apache Spark运行一个独立的应用程序，当我将所有数据作为文本文件加载到RDD时，我得到了以下错误： at org.apache.spark.rdd.RDD.iterator(RDD.scala:230) at org.apache.spark.<

浏览 10提问于2015-02-28得票数 0

1回答

当为多个文件提供文件路径时，Springboot | Spark.read失败

、、

在Win10中，在IntelliJ中，此路径(“C:/hive/Orders_0-9*.csv”)在作为独立java spark作业运行时工作良好。但不是作为Spring Boot spark工作。spring boot似乎没有检测到本机文件系统。不确定如何解决此问题。org.apache.hadoop.fs.FileUtil.canRead(FileUtil.java:1230) at org.apache.hadoop.fs.FileUtil.list(a

浏览 3提问于2019-09-05得票数 0

1回答

Hbase客户端连接失败

、、、

我正在尝试建立一个远程hbase服务器和一个简单的web java应用程序之间的简单连接。[error] at scala.Option.map(Option.scala:146) [error] at play.

浏览 0提问于2015-10-09得票数 3

2回答

卡桑德拉输入/输出火花

、、、

实现是使用Spring与数据库的集成。return new CassandraTemplate(session().getObject());DataProcessor.main方法： // Initialize spring

浏览 3提问于2014-06-27得票数 8

回答已采纳

4回答

海布里是否使用Spring框架？

、

它使用Spring框架吗？另外，请大家分享链接/材料，以更多地了解它的架构，技术等？技术： Spring、JSF (FrontEnd)、REST Web服务？用户界面：产品驾驶舱，CMS驾驶舱，打印驾驶舱，管理驾驶舱，HMC应用服务器：海布里斯服务器，Oracle，，JBossIMP:为Spring REST提供SAP Hybr

浏览 8提问于2016-12-12得票数 1

回答已采纳

1回答

在Spark应用程序中使用

、、

我试图使用org.apache.directory.api创建到LDAP服务的连接，并将其作为Spark应用程序的一部分进行查询。当我将LDAP用作Java应用程序的一部分时，用于连接和查询LDAP的Scala代码可以正常工作，但作为Spark应用程序的一部分执行时，它会产生如下错误消息：[INFO] | | +- org.apache.hadoop

浏览 2提问于2020-05-05得票数 1

回答已采纳

1回答

SBT在导入Spark的依赖项时出现错误

、、、、

$IvySbt$$action$1(Ivy.scala:70)[error] at xsbt.boot.Using$.withResource(Using.scala:12)(Locks.scala:119) [error] at xsbt.boot.Lock

浏览 234提问于2021-09-18得票数 1

回答已采纳

3回答

通过Dataproc实现星火作业的Hadoop安全GroupMappingServiceProvider异常

、、、、

$$anonfun$getCurrentUserName$1.apply(Utils.scala:2430) at org.apache.spark.api.java.JavaSparkContext.版本：1.1.51和1.2.15区域:全球工作类型:火花 Jar文件:gs://b

浏览 10提问于2017-12-21得票数 5

回答已采纳

1回答

在从GCS读取时，Pyspark作业陷入睡眠和重试循环。

、、、、

服务帐户具有完全访问权限，我能够使用同一个服务帐户在同一个executor容器上使用gsutil获取文件。这似乎排除了网络或权限问题。at scala.collection.AbstractIterator.foreach(Iterator.scala:1334) at org.apache.spark.api.python.PythonRDDat scala.collection.AbstractIterator.foreach(Iterator.scala<

浏览 3提问于2019-07-12得票数 2

1回答

从Spark访问Hdfs会导致TokenCache错误，无法获得主Kerberos主体作为更新程序

、、、

at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat，无法获得主Kerberos作为续订者的( org.apache.hadoop.mapred.FileInputFormat.getSplits) at org.apache.spark.api.python.PythonRDD.getPartitions(PythonRDD.scala:46) at org.apache.spark.rdd.RDD(SparkCon

浏览 1提问于2014-04-23得票数 7

回答已采纳

8回答

Scala中的MapReduce实现

、、、

我想找出好的和健壮的MapReduce框架，可以在Scala中使用。

浏览 0提问于2009-06-07得票数 28

回答已采纳

2回答

使用SparkR 1.5从RStudio中的hdfs读取大文件(纯文本、xml、json、csv)的选项

、、

数据可以是任何类型(纯文本、csv、json、xml或任何包含关系表的数据库)和任何大小(1kb -几gb)。:87) at org.apache.spark.sql.api.r.SQLUtils$.loadDF(SQLUtils.scala:156) at org.apache.spark.sql.api.r.SQLUtils.loadD

浏览 6提问于2015-09-15得票数 5

点击加载更多