Spark 调优(四):Haoop 调优

栏目: 服务器 · 发布时间: 6年前

内容简介:TODO执行为了避免每次启动 Spark 应用都重新分发 JAR,可以通过配置

HDFS 调优

数据本地化

TODO

YARN 调优

加速应用启动

执行 spark-shell --master yarnspark-submit --master yarn 在 YARN 上启动 Spark 的时候,会将 {SPARK_HOME}/jars 目录下的 JAR 文件压缩成 ZIP 文件,上传至 HDFS /user/{user}/.sparkStaging 应用目录下

为了避免每次启动 Spark 应用都重新分发 JAR,可以通过配置 spark.yarn.jars 指定 JAR 在 HDFS 的路径。

拷贝 Spark 依赖包到 HDFS:

hdfs dfs -copyFromLocal {SPARK_HOME}/jars /lib/spark

编辑 $SPARK_HOME/conf/spark-defaults.conf 文件:

spark.yarn.jars=hdfs://host:port/lib/spark/jars/*.jar

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

游戏运营:高手进阶之路

游戏运营:高手进阶之路

饭大官人 / 电子工业出版社 / 2018-1-1 / 79.00元

《游戏运营:高手进阶之路》是一本系统的、成体系的、注重运营效能、强化系统思维、提升专业认知的书籍。《游戏运营:高手进阶之路》几乎完整覆盖了一个游戏运营人员日常工作中的方方面面,并从工作中具体的业务场景出发,归纳整理出各种解决问题的方法论。《游戏运营:高手进阶之路》为广大游戏从业者建立了完整的知识技能成长体系,包含两大岗位基本功—内容输出和协作推进,四大职业技能—活动策划、版本管理、用户运营、数据分......一起来看看 《游戏运营:高手进阶之路》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

随机密码生成器
随机密码生成器

多种字符组合密码