内容简介:TODO执行为了避免每次启动 Spark 应用都重新分发 JAR,可以通过配置
HDFS 调优
数据本地化
TODO
YARN 调优
加速应用启动
执行 spark-shell --master yarn
或 spark-submit --master yarn
在 YARN 上启动 Spark 的时候,会将 {SPARK_HOME}/jars
目录下的 JAR 文件压缩成 ZIP 文件,上传至 HDFS /user/{user}/.sparkStaging 应用目录下
为了避免每次启动 Spark 应用都重新分发 JAR,可以通过配置 spark.yarn.jars 指定 JAR 在 HDFS 的路径。
拷贝 Spark 依赖包到 HDFS:
hdfs dfs -copyFromLocal {SPARK_HOME}/jars /lib/spark
编辑 $SPARK_HOME/conf/spark-defaults.conf 文件:
spark.yarn.jars=hdfs://host:port/lib/spark/jars/*.jar
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
算法技术手册
George T. Heineman、Gary Pollice、Stanley Selkow / 杨晨、李明 / 机械工业出版社 / 2010-3 / 55.00元
《算法技术手册》内容简介:开发健壮的软件需要高效的算法,然后程序员们往往直至问题发生之时,才会去求助于算法。《算法技术手册》讲解了许多现有的算法,可用于解决各种问题。通过阅读它,可以使您学会如何选择和实现正确的算法,来达成自己的目标。另外,书中的数学深浅适中,足够使您可以了解并分析算法的性能。 较之理论而言,《算法技术手册》更专注于应用。《算法技术手册》提供了高效的代码解决方案,使用多种语言......一起来看看 《算法技术手册》 这本书的介绍吧!
RGB转16进制工具
RGB HEX 互转工具
HTML 编码/解码
HTML 编码/解码