Spark 调优(四):Haoop 调优

栏目: 服务器 · 发布时间: 5年前

内容简介:TODO执行为了避免每次启动 Spark 应用都重新分发 JAR,可以通过配置

HDFS 调优

数据本地化

TODO

YARN 调优

加速应用启动

执行 spark-shell --master yarnspark-submit --master yarn 在 YARN 上启动 Spark 的时候,会将 {SPARK_HOME}/jars 目录下的 JAR 文件压缩成 ZIP 文件,上传至 HDFS /user/{user}/.sparkStaging 应用目录下

为了避免每次启动 Spark 应用都重新分发 JAR,可以通过配置 spark.yarn.jars 指定 JAR 在 HDFS 的路径。

拷贝 Spark 依赖包到 HDFS:

hdfs dfs -copyFromLocal {SPARK_HOME}/jars /lib/spark

编辑 $SPARK_HOME/conf/spark-defaults.conf 文件:

spark.yarn.jars=hdfs://host:port/lib/spark/jars/*.jar

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

解码宇宙

解码宇宙

(美) 塞费 / 隋竹梅 / 上海科技教育出版社 / 2010-4 / 26.00元

《解码宇宙:新信息科学看天地万物》:宇宙,或许就是一台庞大的计算机。这是查尔斯·塞费在《解码宇宙:新信息科学看天地万物》中对宇宙做出的结论。作者从信息的特点开始谈起,详细论述了信息论和量子计算,向我们展示了一种不可思议的拜占庭式宇宙的情景,涉及生命的本质、热力学、相对论、量子力学、黑洞、多重宇宙,直至宇宙的命运。《解码宇宙:新信息科学看天地万物》资料翔实,内容丰富多彩,思路清晰,观点明确,读后使人......一起来看看 《解码宇宙》 这本书的介绍吧!

在线进制转换器
在线进制转换器

各进制数互转换器

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试