如何在多项目sbt设置中包含lib下的jars？ - 腾讯云开发者社区

在我们的Scala项目中，可以直接将要依赖的jar包放在module的lib文件夹下，在使用sbt执行编译和打包任务时，会自动将lib下的jar包放入classpath中。...那么，需要解决的第一个问题是：由于客户的jar包不能拷贝到我的开发环境中，该如何处理该依赖？既然在开发环境下拿不到这个jar包，那就做一个mock包吧。...其中ServiceConfig提供了认证需要的属性值，并通过set方法进行设置。...实际上，sbt assembly并不会将所有依赖的外部包都装配到最终的部署包中，只要在sbt的依赖中添加provided，就能保证第三方依赖包不被包含进部署包中。...这就是在本地设置classpath不生效的根本原因。

4.3K9 0

ScalaPB（4）：通用跨系统protobuf数据，sbt设置

用户首先在.proto文件中用IDL来定义系统中各种需要进行交换的数据类型。然后用protoc编译器自动产生相关的源代码，里面包括了完整的序列化处理函数。...在使用方sbt项目里可以用unmanagedBase指定.jar路径或者把包放到默认的lib/目录下： lazy val commonSettings = Seq( name := "using-common-protobuf-data...scalapb.compiler.Version.scalapbVersion % "protobuf" ), ) unmanagedBase := file("/users/tiger-macpro/jars...在上面的.sbt文件中有关路径的设置需要总结一下： 1、改变默认源代码路径: (src/main/scala， src/test/scala) scalaSource in Compile := baseDirectory.value.../) unmanagedBase := baseDirectory.value / "jars" //只在编译时引用 unmanagedBase in Compile := baseDirectory.value

1.2K4 0

您找到你想要的搜索结果了吗？

是的

没有找到

Spark 开发环境搭建

HDFS 是 Hadoop 项目中的一个组件，本文中说明的部署方式仅为在单机上搭建完整开发环境（只包含一个 NameNode 和一个 DataNode，无 HA 支持），生产环境会复杂一些，请参阅 HDFS...4.2 配置虽然可以零配置启动服务，但为了开发时对系统有更多控制，简单说明下开发中可能会修改的几个基础配置。...java vm 参数 --- lib/ # 预装 jar 包 5.2 sbt 工程样例将上面在交互模式下运行的单词计数使用独立的 scala 程序实现。...托管依赖指在远程组件仓库（maven, ivy 等）管理的依赖包，工程中定义声明下使用的版本，编译时直接从远程下载。非托管依赖只存在于本地的依赖包，默认为工程根目录下 "lib" 子目录。.../jars lib sbt 会首先从本地库中寻找寻找被引用组件包。

6.9K2 1

Spark的那些外部框架

包添加到你指定的路径下。...如果要在你的项目中包含此插件，请务必在sbt项目的project/plugins.sbt文件中写入下面的代码： resolvers += "bintray-Spark-packages" at "https...% "0.2.3") 发布Spark包时必须提供如下信息，应该把它们写到build.sbt中： spName——package的名称。...选择package的名称上面的简短描述和主页最好与build.sbt中的描述和主页URL一致。一旦你提交了package，验证过程就开始了。这个过程通常需要几分钟。...虽然这个库仍然在开发中，但由于它是一个开源项目，因此可能很快就会被应用到实际场景。如果你打算在内部使用以处理日常数据，那么spark-jobserver是一个不错的选项。

1.3K1 0

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（一）

在笔者看来，Spark中的线索就是如果让数据的处理在分布式计算环境下是高效，并且可靠的。...Cassandra NoSQL数据库的选择之痛，目前市面上有近150多种NoSQL数据库，如何在这么庞杂的队伍中选中适合业务场景的佼佼者，实非易事。...Create index on person(fname); Cassandra目前只能对表中的某一列建立索引，不允许对多列建立联合索引。...将其配置成为JVM HEAP的1/4会是一个比较好的选择。如果该值设置太大，会导致不停的FULL GC，那么在这种情况下Cassandra基本就不可用了。...如看一下读取的完成情况 nodetool -hcassandra_server_address tpstats 检查整个cluster的状态 nodetool -hcassandra_server_address

2.7K8 0

Spark2.3.0 使用spark-submit部署应用程序

为此，需要创建一个包含代码及其依赖关系的 assembly jar（或 Uber jar）。sbt 和 Maven 都有 assembly 插件。...local[K] 使用K个工作线程本地运行 Spark（理想情况下，设置这个值的数量为你机器内核数量）。...高级依赖管理使用 spark-submit 时，包含在 --jars 选项中的应用程序 jar 以及其他 jar 将自动分发到集群。在 --jars 之后提供的 URL 列表必须用逗号分隔。...该列表会包含在 driver 和 executor 的 classpath 中。--jars 不支持目录的形式。...可以使用配置选项 --repositories 以逗号分隔的方式添加其他存储库（或SBT中的解析器）。

3K4 0

sbt的依赖管理逻辑

：托管依赖项是指通过在项目的构建文件（通常是build.sbt）中声明依赖项，然后由构建工具自动从远程仓库（如Maven中心）下载所需的库和框架。...我们举个例子：如果您有要在项目中使用的 jar 文件（非托管依赖项），只需将它们复制到 sbt 项目根目录下的 lib 文件夹中，sbt 就会自动找到它们。...build.sbt: 项目的主构建文件，包含了项目的设置（settings）、依赖项（dependencies）和任务（tasks）等。这是定义项目构建过程的关键文件。...plugins.sbt: 这个文件包含了项目所使用的sbt插件的配置。插件可以添加新的功能和任务到项目的构建过程中。 src/: 这个目录包含了项目的源代码和资源文件。...这些文件包含了项目的元数据，如项目名称、版本、依赖项等信息。 2 解析依赖项当 sbt 启动时，它会读取配置文件，并解析项目的依赖项。

1791 0

sbt 项目导入问题

，换个环境，sbt 经常会出现编译项目出错的情况，导入 IDEA 又各种报错，尤其是在 github 上找到一个 sbt 编译的项目，想 clone 下来导入 IDEA 中阅读源码，跑跑测试用例，debug...下载后，解压到自己的软件安装路径上，例如我的，/usr/local/sbt，然后设置环境变量。确认一下 sbt 配置（这个后面会细说）。...2.2 IDEA sbt 的配置问题如果在本地都能构建项目成功，那么在 IDEA 中也应该成功，因为 IDEA 是支持 sbt 项目的。但这里会有一些坑需要注意一下的。...不管是导入还是创建新的 sbt 项目，都应该检查一下 IDEA 的 sbt 配置，这里以笔者的配置为例。 ?...2.3 一些测试为了测试 sbt 的配置是否正确了，建议利用 IDEA 创建和导入一个 sbt 项目，尤其是导入一个开源的 sbt 项目，因为这些项目相对比较复杂，sbt 的配置文件中包含了大量的插件和

2.5K4 0

大数据基础系列之提交spark应用及依赖管理

为了达到这个目的，需要创建一个assembly jar或者super jar，这个jar要同时包含你的代码和它的依赖。Sbt和maven都有assembly 插件。...一个通用的部署策略是在一个集群入口机器上提交你的程序到集群(比如，在EC2集群中的master节点)。在这种设置中，client模式是合适的。...默认情况下会从conf/spark-defaults.conf读取。 Spark默认配置的优先级是SparkConf设置的，spark-submit设置的，然后是默认配置文件读取的。...--jars参数指定URLs必须用逗号分隔，该列表包含在driver和Executor Classpath上。目录不适用于--jars。...可以使用--repositories参数将另外的repositories 或者SBT的resolvers依赖以逗号分割的方式加入。

1.3K9 0

傻白甜，约不约？

首先来介绍下，今天的主角“傻白甜”（SBT:Simple Build Tools），其功能与 Maven 和 Gradle 类似。...而且 Sbt 默认会从一些奇奇怪怪的地方下载依赖，相信大家的第一次，都不会很美好（ Sbt 的项目构建异常缓慢，而且还经常会失败），笔者也不例外，所以有了这篇文章，希望对你有些帮助。...=true ，也可以通过设置环境变量 SBT_OPTS="-Dsbt.override.build.repos=true" 实现。...这里需要说明，如果需要指定自己的 sbt ，并不能像其他软件，设置倒跟目录就行，这里需要指定倒 bin 目录下的 sbt-launch.jar 编译一下，会发现舒爽很多了。...sbt 项目依赖在使用 scala 的时候，大家一定要注意自己的sdk版本以及配置的依赖包的版本要一致，如果不符，就会出现各种奇怪的问题 libraryDependencies += "org.apache.spark

8213 0

Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN

打包应用依赖如果您的代码依赖了其它的项目，为了分发代码到 Spark 集群中您将需要将它们和您的应用程序一起打包。...为此，创建一个包含您的代码以及依赖的 assembly jar（或者 “uber” jar）。无论是 sbt 还是 Maven 都有 assembly 插件。...该列表必须包含由zookeeper设置的高可用集群中的所有master主机。该 port（端口）必须有一个作为您的 master 配置来使用，默认是 7077。...一般情况下，明确设置在 SparkConf 上的配置值的优先级最高，然后是传递给 spark-submit的值, 最后才是 default value（默认文件）中的值。...在 --jars 后面提供的 URL 必须用逗号分隔。该列表会被包含到 driver 和 executor 的 classpath 中。 --jars 不支持目录的形式。

87410 0

Spark Streaming 与 Kafka0.8 整合

1.1 引入对于使用 SBT/Maven 项目定义的 Scala/Java 应用程序，请引入如下工件（请参阅主编程指南中的Linking部分以获取更多信息）。...对于 Scala 和 Java 应用程序，如果你使用 SBT 或 Maven 进行项目管理，需要将 spark-streaming-kafka-0-8_2.11 及其依赖项打包到应用程序 JAR 中。...对于缺乏　SBT/Maven 项目管理的 Python 应用程序，可以使用 –packages 直接将 spark-streaming-kafka-0-8_2.11 及其依赖添加到 spark-submit...或者，你也可以从 Maven 仓库中下载 spark-streaming-kafka-0-8-assembly 的JAR，并将其添加到 spark-submit -jars 中。 2....２.1 引入对于使用 SBT/Maven 项目定义的 Scala/Java 应用程序，请引入如下工件（请参阅主编程指南中的Linking部分以获取更多信息）。

2.3K2 0

PySpark初级教程——第一步大数据分析(附代码实现)

) 当你处理一个包含很少源代码文件的小型项目时，手动编译它们会更容易。...但是，如果你正在处理一个包含数百个源代码文件的大型项目呢?在这种情况下，你需要使用构建工具。 SBT是Scala构建工具的缩写，它管理你的Spark项目以及你在代码中使用的库的依赖关系。.../lib/jvm/java-8-openjdk-amd64 export SBT_HOME=/usr/share/sbt/bin/sbt-launch.jar export SPARK_HOME=/...假设我们有一个文本文件，并创建了一个包含4个分区的RDD。现在，我们定义一些转换，如将文本数据转换为小写、将单词分割、为单词添加一些前缀等。...Spark是数据科学中最迷人的语言之一，我觉得至少应该熟悉它。这只是我们PySpark学习旅程的开始!我计划在本系列中涵盖更多的内容，包括不同机器学习任务的多篇文章。

4.5K2 0

如何在启用Sentry的CDH集群中使用UDF

1.文档编写目的 ---- 在前面的文章Fayson介绍过UDF的开发及使用《如何在Hive&Impala中使用UDF》，大多数企业在使用CDH集群时，考虑数据的安全性会在集群中启用Sentry服务，这样就会导致之前正常使用的...本篇文章主要讲述如何在Sentry环境下使用自定义UDF函数。...sql-udf-utils-1.0-SNAPSHOT.jar /usr/lib/hive-udf-jars/ [ec2-user@ip-172-31-22-86 ~]$ ll /usr/lib/hive-udf-jars...集群启用了Sentry服务，Hive创建函数时指定的是本地的jars，导致在Impala中无法直接使用Hive的函数，需要在Impala shell下重新创建。...）任何用户都可以DROP掉任何Function，不管它有什么权限，即使这个用户没有这个数据库的权限，也可以DROP掉这个数据库下的Function，只要带上Function的全路径，如： DROP

4K9 0

Spark新愿景：让深度学习变得更加易于使用

当然牛好吹，也是要做些实际行动的，所有便有了spark-deep-learning项目。这件事情已经有很多人尝试做了，但显然太浅了，DB公司则做的更深入些。...实际上Spark采用了2和3的结合。第二条容易理解，第三条则主要依赖于另外一个项目tensorframes。这个项目主要是实现tensorflow和spark的互相调用。...home 里的lib目录），这样你在spark-deep-learning里就可以直接做开发了。...（你可以通过一些python的管理工具来完成版本的切换），然后进行编译： build/sbt assembly 编译的过程中会跑单元测试，在spark 2.2.0会报错，原因是udf函数不能包含“-”，...如果你导入项目，想看python相关的源码，但是会提示找不到pyspark相关的库，你可以使用： pip install pyspark 这样代码提示的问题就被解决了。

1.3K2 0

Spark新愿景：让深度学习变得更加易于使用

实际上Spark采用了2和3的结合。第二条容易理解，第三条则主要依赖于另外一个项目tensorframes。这个项目主要是实现tensorflow和spark的互相调用。...home 里的lib目录），这样你在spark-deep-learning里就可以直接做开发了。...所以你需要在build.sbt里第一行修改为 val sparkVer = sys.props.getOrElse("spark.version", "2.2.0") 同时保证你的python为2.7版本...（你可以通过一些python的管理工具来完成版本的切换），然后进行编译： build/sbt assembly 编译的过程中会跑单元测试，在spark 2.2.0会报错，原因是udf函数不能包含“-”，...如果你导入项目，想看python相关的源码，但是会提示找不到pyspark相关的库，你可以使用： pip install pyspark》这样代码提示的问题就被解决了。

1.8K5 0

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

CDH中启用Spark Thrift》,《如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端》，《如何在Kerberos环境下的CDH集群部署Spark2.1...本篇文章Fayson主要介绍如何在Kerberos环境下的CDH集群中部署Spark2.1的Thrift Server服务和Spark SQL客户端。...Fayson昨天的文章标题有错误，Spark2.1 SQL是非Kerberos的，今天才是介绍Kerberos环境下安装配置。...4.将/opt/cloudera/parcels/SPARK2/lib/spark2/jars目录下的所有jar上传至HDFS，如果目录不存在则创建 [root@cdh03 jars]# kinit spark...注意：为了防止和HiveServer2的10000端口冲突，可以在启动脚本中增加如下配置自定义端口，端口默认绑定的地址为127.0.0.1，不能远程访问需要将指定绑定host，0.0.0.0为监听所有IP

2.6K5 0

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

Fayson的github： https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在前面的文章Fayson介绍了《如何在...CDH中启用Spark Thrift》和《如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端》，本篇文章Fayson主要介绍如何在非Kerberos环境下的.../SPARK2/lib/spark2/jars/*hive*.jar （可左右滑动） ?...4.将/opt/cloudera/parcels/SPARK2/lib/spark2/jars目录下的所有jar上传至HDFS，如果目录不存在则创建 [root@cdh03 jars]# kinit spark...注意：为了防止和HiveServer2的10000端口冲突，可以在启动脚本中增加如下配置自定义端口，端口默认绑定的地址为127.0.0.1，不能远程访问需要将指定绑定host，0.0.0.0为监听所有IP

2.2K3 0

Byteman 使用指南（十一）

最新的 Byteman 版本可作为 zip 文件从 Byteman 项目下载页面获取。下载二进制发行版或完整发行版后，将其安装到希望运行 Byteman 的机器的可访问目录中。...本指南假定环境变量 BYTEMAN_HOME 指向解压后的二进制发行版目录。二进制发行版：包含所有二进制文件（类文件 JARs 和命令脚本）、程序员指南副本、示例脚本以及相关帮助器 JAR。...完整发行版：在二进制发行版的基础上增加源代码和 javadoc JARs。...有关如何在 Ant 构建脚本中配置以引用 Byteman 下载中的必要 JAR 的信息。更复杂的使用示例可参见 Byteman 故障注入教程。...Maven 用户：需在本地 Maven 仓库中安装 Byteman JAR，执行： mvn install 在执行此命令前，应修改根 pom.xml 中的项目版本及子模块的父版本，以避免覆盖中央仓库中的官方版本

560 0

如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端

CDH中启用Spark Thrift》，本篇文章Fayson主要介绍如何在Kerberos环境下的CDH集群中部署Spark1.6的Thrift Server服务和Spark SQL客户端。.../lib [root@cdh04 lib]# cp spark-assembly-1.6.0-hadoop2.6.0.jar /opt/cloudera/parcels/CDH/jars/ （可左右滑动...替换CDH中默认的Spark-assembly jar包 [root@cdh04 jars]# cd /opt/cloudera/parcels/CDH/jars/ [root@cdh04 jars]#...前面《如何在CDH中启用Spark Thrift》处理方式是在/etc/spark/conf/classpath.txt文件末尾增加依赖，这种配置方式在修改Spark客户端配置后会被覆盖，需要重新手动加入...脚本拷贝至/opt/cloudera/parcels/CDH/lib/spark/sbin目录下，并设置执行权限 [root@cdh04 ~]# cd spark-1.6.0-bin-hadoop2.6

2K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Spark Submit的ClassPath问题

ScalaPB（4）：通用跨系统protobuf数据，sbt设置

Spark 开发环境搭建

Spark的那些外部框架

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（一）

Spark2.3.0 使用spark-submit部署应用程序

sbt的依赖管理逻辑

sbt 项目导入问题

大数据基础系列之提交spark应用及依赖管理

傻白甜，约不约？

Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN

Spark Streaming 与 Kafka0.8 整合

PySpark初级教程——第一步大数据分析(附代码实现)

如何在启用Sentry的CDH集群中使用UDF

Spark新愿景：让深度学习变得更加易于使用

Spark新愿景：让深度学习变得更加易于使用

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

Byteman 使用指南（十一）

如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐