spark不下载hive_metastore jars - 腾讯云开发者社区

前提准备兼容性说明注意：官网下载的Hive3.1.3和Spark3.3.1默认是不兼容的。因为Hive3.1.3支持的Spark版本是2.3.0，所以需要我们重新编译Hive3.1.3版本。...而YARN上没有scala依赖来解析spark任务，需要从spark上载Scala依赖至HDFS，从HDFS下载至YARN（NM）上。...hadoop fs -mkdir /spark-history# 向HDFS上传Spark纯净版jar包# 说明1：采用Spark纯净版jar包，不包含hadoop和hive相关依赖，能避免依赖冲突。...hadoop fs -mkdir /spark-jarshadoop fs -put /opt/module/spark/jars/* /spark-jars修改hive-site.xml文件vim /...//hadoop102:8020/spark-jars/* <!

2352 1

docker搭建spark集群

1.安装配置基础Spark 【在test-cluster-hap-master-01虚拟主机上】将已下载好的Spark压缩包（spark-3.1.1-bin-hadoop-3.2.2-lbx-jszt.tgz...-3.1.1/logs \ -v ${log}/work:/usr/local/spark-3.1.1/work \ -v ${log}/jars:/usr/local/spark-3.1.1/jars...-3.1.1/logs \ -v ${log}/work:/usr/local/spark-3.1.1/work \ -v ${log}/jars:/usr/local/spark-3.1.1/jars...-3.1.1/logs \ -v ${log}/work:/usr/local/spark-3.1.1/work \ -v ${log}/jars:/usr/local/spark-3.1.1/jars...这里遇到了许多问题，第一个是包不兼容，导致搭建两次失败然后换了官方的包spark-3.1.1-bin-without-hadoop，启动还是有问题。

6101 0

您找到你想要的搜索结果了吗？

是的

没有找到

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

1.下载spark-2.1.0-bin-hadoop2.6.tgz，官网下载地址如下： http://mirrors.hust.edu.cn/apache/spark/spark-2.1.0/spark...2.将下载的spark-2.1.0-bin-hadoop2.6.tgz包解压 [root@cdh03 ~]# tar -zxvf spark-2.1.0-bin-hadoop2.6.tgz （可左右滑动.../jars/ [root@cdh03 jars]# ll *hive*.jar [root@cdh03 jars]# cp hive-cli-1.2.1.spark2.jar spark-hive-thriftserver.../jars/ [root@cdh03 jars]# hadoop fs -mkdir -p /user/spark/share/spark2-jars [root@cdh03 jars]# hadoop...5.通过CM修改Spark的配置配置spark.yarn.jars路径 spark.yarn.jars=hdfs://nameservice1/user/spark/share/spark2-jars

2.2K3 0

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

1.下载spark-2.1.0-bin-hadoop2.6.tgz，官网下载地址如下： http://mirrors.hust.edu.cn/apache/spark/spark-2.1.0/spark...-2.1.0-bin-hadoop2.6.tgz （可左右滑动） 2.将下载的spark-2.1.0-bin-hadoop2.6.tgz包解压 [root@cdh03 ~]# tar -zxvf spark.../jars/ [root@cdh03 jars]# ll *hive*.jar [root@cdh03 jars]# cp hive-cli-1.2.1.spark2.jar spark-hive-thriftserver.../jars/ [root@cdh03 jars]# hadoop fs -mkdir -p /user/spark/share/spark2-jars [root@cdh03 jars]# hadoop...5.通过CM修改Spark的配置配置spark.yarn.jars路径 spark.yarn.jars=hdfs://nameservice1/user/spark/share/spark2-jars

2.6K5 0

如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端

1.下载spark-1.6.0-bin-hadoop2.6.tgz，官网下载地址如下： https://archive.apache.org/dist/spark/spark-1.6.0/spark-1.6.0...-bin-hadoop2.6.tgz （可左右滑动） 2.将下载的spark-1.6.0-bin-hadoop2.6.tgz包解压 [root@cdh04 ~]# tar -zxvf spark-1.6.0...替换CDH中默认的Spark-assembly jar包 [root@cdh04 jars]# cd /opt/cloudera/parcels/CDH/jars/ [root@cdh04 jars]#....jar /user/spark/share/jars [root@cdh04 lib]# hadoop fs -ls /user/spark/share/jar （可左右滑动） ?...配置GateWay使用spark.yarn.jar spark.yarn.jar=hdfs://nameservice1/user/spark/share/jars/spark-assembly-1.6.0

2K4 0

Spark SQL+Hive历险记

的版本，我这里是2.11.7 （2）下载spark-1.6.0源码，解压进入根目录编译（3）dev/change-scala-version.sh 2.11 修改pom文件，修改对应的hadoop..._2.11-1.0.jar //这是主体的jar，不用跟--jars放在一起，否则会有问题 //spark alone模式 bin/spark-submit --class com.tools.hive.SparkHive..._2.11-1.0.jar //这是主体的jar，不用跟--jars放在一起，否则会有问题以Spark SQL 方式查询，不一定非得让你写代码，这就是sql的魅力，spark sql也能使用sql...alone模式 bin/spark-sql --master spark://h1:7077 --files conf/hive-site.xml --jars lib/ datanucleus-api-jdo...参考链接： winuitls.exe下载地址，如果再win上想远程连接spark alone集群提交任务，可能要用到： http://teknosrc.com/spark-error-java-io-ioexception-could-not-locate-executable-null-bin-winutils-exe-hadoop-binaries

1.3K5 0

ONgDB图数据库与Spark的集成

下载案例项目源代码可以帮助新手快速开始探索，不必踩坑。大致流程是先在Spark集群集成图数据库插件，然后使用具体API构建图数据分析代码。...在Spark集群安装neo4j-spark插件下载组件 https://github.com/ongdb-contrib/neo4j-spark-connector/releases/tag/2.4.1...-M1 下载组件放在spark安装目录的jars文件夹 E:\software\ongdb-spark\spark-2.4.0-bin-hadoop2.7\jars 基础组件依赖信息版本信息 Spark...winutils neo4j-spark-connector-full-2.4.1-M1 【把jar包放到spark/jars文件夹里】 scala-2.11.12 创建测试数据 UNWIND range...下载依赖包如果出现问题请检查下面网址是否可以正常下载Spark相关的JAR包 http://dl.bintray.com/spark-packages/maven 案例项目截图【使用前在本地启动Spark

4503 0

解决spark streaming重复提交第三方jar包问题

背景：由于spark streaming每次提交都需要上传大量jar包到hdfs，为节约HDFS资源，现只存一份来解决这个问题组件： CDH 5.13 spark2.2.x 针对cluster...模式对于spark streaming而言，第三方jar包是一个值得探讨的问题，相信大部分都是打的源码包，然后提交jar，想通过–jars $(echo sparklib0.10/*.jar | tr...非公共部分，可继续使用–jars来提交 --jars $(echo sparklib0.10/*.jar | tr ' ' ',') 整体上是这个样子的 --jars $(`echo hadoop fs...-ls hdfs://nameservice1/sparklib010/*.jar` |awk {'print $8'}| tr '\n' ',') --jars --jars $(echo sparklib0.10.../*.jar | tr ' ' ',') client模式对于HDFS上的包，首次使用它会下载下来，然后在传上去，用不用公共包自行定夺喽 ?

1.4K3 0

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（一）

答案显然是No,只要你不坚持用RDBMS的思路来解决问题就是了。比如我们有两张表，一张表(Departmentt)记录了公司部门信息，另一张表(employee)记录了公司员工信息。...程序的话，只需要在build.sbt中加入如下内容即可由sbt自动下载所需要的spark-cassandra-connector驱动 datastax.spark" %% "spark-cassandra-connector...，要想确切知道有哪些版本可以由sbt自动下载的话，可以通过maven的仓库来查看，具体查看地址是 http://mvnrepository.com/artifact/com.datastax.spark...spark.cassandra.auth.username cassandra spark.cassandra.auth.password cassandra 3.2.2 依赖包的版本问题 sbt会自动下载...所依赖的包，多个包之间用冒号(:)分割 --jars driver和executor都需要的包，多个包之间用逗号(,)分割为了简单起见，就通过—jars来指定依赖，运行指令如下 $SPARK_HOME

2.7K8 0

Spark2.x学习笔记：1、Spark2.2快速入门（本地模式）

（比如迅雷）加速下载。...（4）通过多线程下载工具加速下载选择一个最近的镜像，比如此处选择清华大学镜像，通过wget命令wget http://mirrors.tuna.tsinghua.edu.cn/apache/spark.../spark-2.2.0/spark-2.2.0-bin-hadoop2.7.tgz直接下载。...-2.2.0/examples/jars/scopt_2.11-3.3.0.jar at spark://192.168.1.180:40549/jars/scopt_2.11-3.3.0.jar with.../jars/spark-examples_2.11-2.2.0.jar at spark://192.168.1.180:40549/jars/spark-examples_2.11-2.2.0.jar

2.2K10 0

Spark on yarn

下载安装包；解压：tar zxvf spark-3.0.0-bin-hadoop3.2.tgz；配置 spark-env.sh export JAVA_HOME=/data/template/j/java...spark.yarn.jars hdfs://cluster01/spark/jars spark.yarn.stagingDir...hdfs://cluster01/spark/jars $ hdfs dfs -mkdir -p hdfs://cluster01/spark/tmp/stagings $ hdfs dfs -put.../jars/* hdfs://cluster01/spark/jars/ 系统环境配置编辑 ~/.bashrc export SPARK_HOME=/data/template/s/spark/spark...-3.0.0-bin-hadoop3.2 export CLASSPATH=$SPARK_HOME/jars/:$CLASSPATH export CLASSPATH=$SPARK_HOME/yarn/

1.6K2 0

【Spark】用scala2.11编译打包构建镜像

用 Scala 2.11 编一次，而 Maven 的仓库里应该只有 Scala 2.12 编出来的 jar 依赖可以供下载，所以如果你的需求是下面那样的：可以用 Spark 2.4.5，并且用户的代码是用.../jars/spark-graphx_2.11-2.4.5.jar /root/tx/spark-all/spark/assembly/target/scala-2.11/jars/spark-kubernetes...-2.11/jars/spark-streaming_2.11-2.4.5.jar /root/tx/spark-all/spark/assembly/target/scala-2.11/jars/spark-tags.../spark/dist/examples/jars + cp /root/tx/spark-all/spark/examples/target/scala-2.11/jars/aircompressor.../spark/dist/jars/commons-lang-2.6.jar ']' + rm /root/tx/spark-all/spark/dist/examples/jars/commons-lang

1.2K4 1

Apache Zeppelin 中 Spark 解释器

有关Spark＆Zeppelin版本兼容性的更多信息，请参阅Zeppelin下载页面中的“可用的口译员”部分。请注意，不导出SPARK_HOME，它以本地模式运行，包含版本的Spark。...用户可以设置分发库的Spark属性有：火花defaults.conf SPARK_SUBMIT_OPTIONS 描述 spark.jars --jars 包含在驱动程序和执行器类路径上的本地jar的逗号分隔列表...spark.jars.packages --packages 逗号分隔列表，用于包含在驱动程序和执行器类路径上的jar的maven坐标。...,/path/mylib2.zip,/path/mylib3.egg" SPARK_HOME/conf/spark-defaults.conf spark.jars /path...当你的代码需要外部库，而不是下载/复制/重新启动Zeppelin，你可以使用%spark.dep解释器轻松地完成以下工作。

4K10 0

TiSpark (Beta) 用户指南

四、部署 TiSpark TiSpark 的 jar 包可以在这里下载。 4.1 已有 Spark 集群的部署方式在已有 Spark 集群上运行 TiSpark 无需重启集群。...可以使用 Spark 的 --jars 参数将 TiSpark 作为依赖引入: spark-shell --jars $PATH/tispark-0.1.0.jar 如果想将 TiSpark 作为默认组件部署...，只需要将 TiSpark 的 jar 包放进 Spark 集群每个节点的 jars 路径并重启 Spark 集群： ${SPARK_INSTALL_PATH}/jars 这样无论你是使用 Spark-Submit...4.2.1 下载安装包并安装你可以在这里下载 Apache Spark。...请将 TiSpark jar 包拷贝到 ${SPARKPATH}/jars 目录下。

2.3K0 0

如何在CDH中启用Spark Thrift

版本为5.13.0 2.采用root用户操作前置条件 1.Spark1.6.0 On Yarn模式 2.部署Spark-assembly Jar包 ---- 1.下载spark-1.6.3-bin-hadoop2.6....tgz，下载地址如下： https://www.apache.org/dyn/closer.lua/spark/spark-1.6.3/spark-1.6.3-bin-hadoop2.6.tgz 2....将下载的spark-1.6.3-bin-hadoop2.6.tgz上传至集群的任意节点并解压，这里以cdh02节点为例 [root@cdh02 ~]# tar -zxvf spark-1.6.3-bin-hadoop2.6.../parcels/CDH/jars/ 4.替换CDH中spark默认的spark-assembly jar包 [root@cdh02 lib]# cd /opt/cloudera/parcels/CDH.../CDH/jars/spark-assembly-1.6.3-hadoop2.6.0.jar /user/spark/share/lib [root@cdh02 lib]# sudo -u spark

6K9 0

Spark 编程入门

1，安装Java8 注意避免安装其它版本的jdk，否则会有不兼容问题。...https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 2，下载spark并解压 http...export PATH=$PATH:$SPARK_HOME/bin 4，配置jupyter支持若未有安装jupyter可以下载Anaconda安装之。...可以在jupyter 中运行spark-shell。使用spark-shell运行时，还可以添加两个常用的两个参数。一个是master指定使用何种分布类型。第二个是jars指定依赖的jar包。...local[*] --jars code.jar #local本地模式运行，使用4个内核 spark-shell --master local[4] #standalone模式连接集群，指定url

1.4K2 0

docker下的spark集群，调整参数榨干硬件

/jars:/root/jars worker: image: gettyimages/spark:2.3.0-hadoop-2.8 container_name: worker.../jars:/root/jars worker1: image: gettyimages/spark:2.3.0-hadoop-2.8 container_name: worker1...应用的功能是分析维基百科的网站统计信息，找出访问量最大的网页，本次实战用现成的jar包，不涉及编码，该应用的源码和开发详情请参照《spark实战之：分析维基百科网站统计数据(java版)》；从github...下载已经构建好的spark应用jar文件： wget https://raw.githubusercontent.com/zq2599/blog_demos/master/files/sparkdemo...-1.0-SNAPSHOT.jar 从github下载维基百科的网站统计信息大数据集，这里只下载了一个文件，建议您参照《寻找海量数据集用于大数据开发实战(维基百科网站统计数据)》下载更多文件用来实战：

1.5K2 0

单机搭建hadoop+hive+spark环境

thrift://localhost:9083 下载文件...HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop 修改slaves文件 cp slaves.template slaves vi slaves 127.0.1.1 cloud python3.6不兼容问题.../conf下 cp hive/conf/hive-site.xml sprak/conf # 复制mysql-connector-java.jar到spark/jars下 ln -s /usr/share.../java/mysql-connector-java.jar $SPARK_HOME/jars/mysql-connector-java.jar # 启动spark spark-shell --jars...$SPARK_HOME/jars/mysql-connector-java.jar

3.5K3 0

Spark笔记15-Spark数据源及操作

如何启动 cd /usr/local/spark/mycode/streaming/socket /usr/local/spark/bin/spark-submit DataSourceSocket.py...localhost 9999 RDD队列流 cd /usr/local/spark/mycode/streaming/rddqueue /usr/local/spark/bin/spark-submit...配置先下载jar包： # 将下载解压后的jar包拷贝到spark的jars目录下 cd /usr/local/spark/jars mkdir kafka cd ~ cp ..../spark-streaming-kafka-0.8_2.11-2.4.0.jar /usr/local/spark/jars/kafka # 将Kafka安装目录下的libs目录下的所有文件复制到spark...的jars目录下 cd /usr/local/kafka/libs cp ./* /usr/local/spark/jars/kafka # 进入libs目录后，将当权目录下的所有文件进行拷贝修改

8001 0

【数据采集与预处理】数据接入工具Kafka

/spark/conf [root@bigdata conf]# vi spark-env.sh 在文件的第一行接着添加如下内容： :/usr/local/spark/examples/jars/*:.../usr/local/spark/jars/kafka/*:/usr/local/kafka/libs/* 接着，在“/usr/local/spark/jars”目录下新建文件夹kafka，并将“/usr...[root@bigdata spark]# cd /usr/local/spark/jars [root@bigdata jars]# mkdir kafka [root@bigdata jars]#...-0-8_2.11-2.4.0.jar的下载地址： http://mvnrepository.com/artifact/org.apache.spark/spark-streaming-kafka-0-...8_2.11/2.4.0 下图是拷贝完成后的“/usr/local/spark/jars/kafka”目录下的所有jar包。

620 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Spark纯净版 Hive on Spark配置

docker搭建spark集群

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端

Spark SQL+Hive历险记

ONgDB图数据库与Spark的集成

解决spark streaming重复提交第三方jar包问题

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（一）

Spark2.x学习笔记：1、Spark2.2快速入门（本地模式）

Spark on yarn

【Spark】用scala2.11编译打包构建镜像

Apache Zeppelin 中 Spark 解释器

TiSpark (Beta) 用户指南

如何在CDH中启用Spark Thrift

Spark 编程入门

docker下的spark集群，调整参数榨干硬件

单机搭建hadoop+hive+spark环境

Spark笔记15-Spark数据源及操作

【数据采集与预处理】数据接入工具Kafka

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐