内容简介:用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。第一步:构建Linux开发环境 Windows操作系统基于虚拟机构建Linux开发环境。虚拟机用VMware,Linux用CentOS7。 VMware虚拟机中安装CentOS7,参考链接:第二步:Linux系统搭建Python工作环境 基于sh安装方式,快速搭建Python工作环境。 执行
用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。
Airflow环境配置
第一步:构建 Linux 开发环境 Windows操作系统基于虚拟机构建Linux开发环境。虚拟机用VMware,Linux用CentOS7。 VMware虚拟机中安装CentOS7,参考链接: https://www.cnblogs.com/smyhvae/p/3917532.html
第二步:Linux系统搭建 Python 工作环境 基于sh安装方式,快速搭建Python工作环境。 执行如下命令:
cd /opt wget https://repo.continuum.io/archive/Anaconda3-5.2.0-Linux-x86_64.sh bash Anaconda3-5.2.0-Linux-x86_64.sh
如果执行wget命令报错,表示centOS7没有连接网络。centOS7配置自动连接网络,参考链接: https://jingyan.baidu.com/article/19192ad8f7c320e53e570728.html 命令执行好后,就可以在Linux系统下进行Python的使用了。
第三步:安装airflow 执行命令
pip install airflow export AIRFLOW_HOME=/home/airflow # 初始化数据库: airflow initdb # 启动服务: airflow webserver (启动airflow
打开浏览器,输入如下URL http://localhost:8080/admin/ 运行成功出现如下页面:
以上所述就是小编给大家介绍的《用户画像系统的作业调度Airflow研究和应用》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
ggplot2:数据分析与图形艺术
哈德利·威克姆 (Hadley Wickham) / 统计之都 / 西安交通大学出版社 / 2013-5-1 / CNY 46.00
中译本序 每当我们看到一个新的软件,第一反应会是:为什么又要发明一个新软件?ggplot2是R世界里相对还比较年轻的一个包,在它之前,官方R已经有自己的基础图形系统(graphics包)和网格图形系统(grid包),并且Deepayan Sarkar也开发了lattice包,看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问,为什么还要发明一套新的系统? 设计理念 打个比......一起来看看 《ggplot2:数据分析与图形艺术》 这本书的介绍吧!