用户画像系统的作业调度Airflow研究和应用

栏目: 服务器 · 发布时间: 7年前

内容简介:用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。第一步:构建Linux开发环境 Windows操作系统基于虚拟机构建Linux开发环境。虚拟机用VMware,Linux用CentOS7。 VMware虚拟机中安装CentOS7,参考链接:第二步:Linux系统搭建Python工作环境 基于sh安装方式,快速搭建Python工作环境。 执行

用户画像系统从业务入手,全面构建用户的标签体系。标签体系的设计和生成需要多个作业协同和有序工作。而用户画像系统的作业调度,就是用来保证多个作业能够协同有序工作。本文是对开源的作业调度系统Airflow的研究和应用探索。

Airflow环境配置

第一步:构建 Linux 开发环境 Windows操作系统基于虚拟机构建Linux开发环境。虚拟机用VMware,Linux用CentOS7。 VMware虚拟机中安装CentOS7,参考链接: https://www.cnblogs.com/smyhvae/p/3917532.html

第二步:Linux系统搭建 Python 工作环境 基于sh安装方式,快速搭建Python工作环境。 执行如下命令:

cd /opt
wget https://repo.continuum.io/archive/Anaconda3-5.2.0-Linux-x86_64.sh
bash Anaconda3-5.2.0-Linux-x86_64.sh

如果执行wget命令报错,表示centOS7没有连接网络。centOS7配置自动连接网络,参考链接: https://jingyan.baidu.com/article/19192ad8f7c320e53e570728.html 命令执行好后,就可以在Linux系统下进行Python的使用了。

第三步:安装airflow 执行命令

pip install airflow
export AIRFLOW_HOME=/home/airflow
# 初始化数据库:
airflow initdb
# 启动服务:
airflow webserver (启动airflow

打开浏览器,输入如下URL http://localhost:8080/admin/ 运行成功出现如下页面: 用户画像系统的作业调度Airflow研究和应用


以上所述就是小编给大家介绍的《用户画像系统的作业调度Airflow研究和应用》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

ggplot2:数据分析与图形艺术

ggplot2:数据分析与图形艺术

哈德利·威克姆 (Hadley Wickham) / 统计之都 / 西安交通大学出版社 / 2013-5-1 / CNY 46.00

中译本序 每当我们看到一个新的软件,第一反应会是:为什么又要发明一个新软件?ggplot2是R世界里相对还比较年轻的一个包,在它之前,官方R已经有自己的基础图形系统(graphics包)和网格图形系统(grid包),并且Deepayan Sarkar也开发了lattice包,看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问,为什么还要发明一套新的系统? 设计理念 打个比......一起来看看 《ggplot2:数据分析与图形艺术》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

URL 编码/解码
URL 编码/解码

URL 编码/解码