内容简介:一套优良的数据分析方法可以让你有条不紊的解决各类问题,摆脱杂乱无章的假设和猜想。面对工作和生活中的一系列问题,你需要一套体系化的数据分析方法论帮助你去伪存真,无限缩短你与正确答案的距离。
一套优良的数据分析方法可以让你有条不紊的解决各类问题,摆脱杂乱无章的假设和猜想。
一套优良的数据分析方法可以让你有条不紊的解决各类问题,摆脱杂乱无章的假设和猜想。面对工作和生活中的一系列问题,你需要一套体系化的数据分析方法论帮助你去伪存真,无限缩短你与正确答案的距离。
一提起数据分析这个词,很多人都会犯难,说自己连Excel都用不好,更别提利用编程的方法去做更高级的数据分析了,其实,这样的想法是有一些多虑的。
数据分析方法已经不是数据分析师的专属了,更不是数据挖掘工程师独享的方法,几乎每一个与业务和产品相关的岗位都需要数据分析方法。
岗位不同,要求则不同,从招聘网站也能看到:像传统的数据分析岗位自然是会要求编程等技能的,但是一些以数据分析助力主要职责的岗位则不要求编程类技能,更多的是数据分析思维,和BI系统分析经验。
有的公司自建BI,有的公司使用第三方BI,鉴于系统保密的原则,本文案例的BI案例均来自友盟demo版,希望本文能带给大家数据分析方面的思悟。
为什么要拥有数据分析能力?
今年互联网行业回归常态,各个岗位的招聘需求回落明显,我爬了某招聘网站的数据发现,招聘名字带‘数据分析’的岗位仍有8000多个·,从实习生到高级管理岗位都有较多需求。也就是说, 有一定数据分析能力的人在找工作时的优势十分明显,岗位薪资均值也高于其他职能类岗位。
所以学习数据分析能力可以加薪这是必然的,这也是为什么要学数据分析的原因。
打破常规的数据分析思维
如果大家看过相关数据课程或者文章,一定了解过各类分析方法,包括大学里的数据分析课程都会介绍很多数据分析方法,你学了一遍又一遍,笔记记了一遍又一遍,但是在最后遇到问题时,仍然不知道该如何下手。
所以要打破常规的数据分析思维,在基础理论之上建立自己的数据分析思维。
从思维能力上看,我认为数据分析能力的提升要遵从这样3个分析原则:
-
第一是要深度理解业务,以及理解生活中遇到的领域问题,不理解业务的分析结论不具有任何参考或者指导意义。所谓理解业务就是要学会拆解业务,用指标衡量业务的发展趋势。
-
第二是拆解业务后, 要基于业务指标建立分析框架 ,并且基于当前业务状态和目标找到可衡量的关键性指标。
-
第三是用数据量化指标,把指标公式化,最佳的状态是每一个指标背后的数据都是最小维度且量化的。
比如以电商店铺的当日销售额为例,
销售额=店铺客单价*付费客户数=客单价*支付人数*支付成功率
支付人数=浏览人数*下单率
浏览人数=商品曝光次数*曝光转化率
所以理论上,在店铺客单价不变的情况下,可以通过提升各个步骤的转化率,以及商品曝光机会来最终提升店铺当日的销售额。
对应的策略可以是加大广告投放量,优化商品详情页,以及下单支付时的各项优惠刺激,去提升曝光量和转化率。
所以可见, 指标公式化量化,就是把它拆解到最小不可分割的可量化的数据指标 ,这一系列拆解背后是对业务关系和流程的理解,如果不理解业务,根本找不到其中指标之间的相关关系。
完成基础拆解后,就是根据目标去找到那些能影响目标的最小可量化的数据指标,加上时间、地区等维度对比分析,找出曾经策略的优劣点,优化策略继续战斗。
如何善用数据分析能力?
发挥数据分析能力之前,首先要熟悉自己使用的数据查询分析系统,也就是BI(商业智能)系统。
如果你还没有使用过BI系统,我这里 以友盟BI为例,简单熟悉一下系统背后的功能指向。
我拿到友盟BI版本基础架构有9个大部分和一个概况汇总,以及对友盟其他产品的推广。具体如下图所示,BI系统的每一个功能模块都有其作用,接下来我简单阐述一下自己对这个系统的理解。
概况里的指标是设计人员认为对产品有利的关键性指标,所以放在一起集中展示,其实其中的每一个指标都是取自下面的9大指标体系,只是起到了一个汇总呈现,集中对比展示的作用。
用户分析模块涉及到用户的拉新和活跃数据,留存分析是单独把新老用户的留存单拎出来统计,通过公式化拆解出2个关键性指标,分别是用户新鲜度和用户活跃度。
渠道分析模 块 是把拉新方式中的渠道投放给细化统计监测,用于区分优劣渠道,核算预算投入产出比,
用户参与度模块我理解的就是把用户活跃度指标继续细化,具体到产品行为产生的数据上,得到使用时长、使用频率、访问页面分布、访问时长间隔分布
功能使用模块则是更进一步把访问页面的行为细化,统计出用户访问的路径是从哪个功能到哪个功能,得出页面访问路径图,还能自定义功能事件并统计到该事件发生的次数,以及事件完成率。
终端属性模块主要是简易的内部用户画像,涉及到机型、地域等。
错误分析模块主要是统计到产品报错的次数和概率,用以及时发现错误,优化各模块的可用性和易用性。
社会化分享模块对应到的是产品中涉及到分享的功能,统计到分享到各个平台的数据,以及进入分享页面后的分享完成率。
消息推送模块和 移动广告监测 主要是推广了友盟另外的产品,就不多说了。
如何利用数据分析能力制定产品和运营策略?
4.1产品策略
这里说的产品策略分为两类,一种是基于用户型app的更新迭代,比如抖音近一年更新42次是如何获得数据支持的,另一种是业务型产品的定价、推陈出新等,比如网贷理财产品的定价。
以抖音为例,我注意到抖音近1年更新42次,上一次更新是9天内,基本上是一周多就更新一次,如何利用BI数据来支持产品的迭代方向呢?
整理抖音近期的更新日志会发现,抖音近期关于“道具玩法”的更新非常多。那这里我们抛出一个问题:
迭代多种新奇好玩的道具玩法能否提升产品的活跃指标呢?
从我观察到的现象来说,抖音有很多平时不发作品的用户,也会尝试道具玩法来增加乐趣,发作品的用户凭借道具玩法就能创造出眼前一亮的短视频,这个功能可以说持续吸引各层级的用户,理应可以增加抖音产品的活跃度。
(抖音新推的复联超能力玩法)
除了从产品逻辑上推断,如果要从BI取数据验证功能逻辑成立,我们需要什么数据呢?数据之间可以证明些什么呢?
抖音道具是一种发布作品时的效果加成,如果你没有作品创意,不知道要发什么,参与道具话题,使用道具的特效加成制作作品也是很好的选择。
(抖音道具玩法常规流程)
我作为外部用户,基于业务我分析出抖音道具功能涉及到的数据指标。
如下图所示,
(抖音道具玩法指标模型)
我认为抖音道具玩法功能的价值点在于贡献更多内容,提升产品作品的受欢迎程度,间接提升了抖音整体的活跃度。
从道具玩法的贡献度和受欢迎程度两个指标继续拆解,我认为 道具玩法作品贡献度=道具作品量/平台作品总量,
道具玩法受欢迎程度=道具玩法作品的推荐转化率*权重1+点赞率*权重2+评论率*权重3,其中三者的权重之和为1,比如推荐转化率占40%,点赞率占30%,评论率占30%,权重的大小分配也是基于对业务的理解程度而定,可以不断调整,当然也可以有意识的调整使其成为了一个好看的数字,体现业务的增长性。
分析完单一功能,继续把视线拉回到抖音产品本身来,道具玩法到底能否提升产品整体的活跃度呢?
先拆解抖音活跃度这个指标,抖音是一款体量非常大的产品, 我把用户活跃义为“使用产品各项功能”,使用时间越长、频次越高,则代表用户越活跃。
基于对活跃的定义,用公式化的思维拆解活跃度就是:
功能活跃度P=使用功能时长T*使用频次N
产品活跃度=P1*权重1+P2*权重2+P3*权重3+P4*权重4
……..
认为产品整体的活跃度的衡量即是产品内各个功能的活跃度之和,由于每一个功能对于产品本身的作用是不同的,所以要添加权重,像看视频、对作品进行互动等这类核心功能权重就高,而像资料设置这类功能权重就低一些。
所以想要衡量产品活跃度是否提升,落实到具体数据上,只需要看产品功能的使用总时长和总频率是否增加,即可验证之前的推测逻辑是否正确。
对于抖音道具玩法功能来说,它可能就是公式中的功能3,它的使用时长和频率就影响着产品的整体活跃度,也对产品作品数量,产品社区氛围有一定的影响。
既然找到了关键性指标是道具玩法的使用时长和频率,也确定它们是可衡量化的数据,所以可以统计,通过BI来展示跟踪,比如友盟BI里就有该模块,可以统计时长和频率
(友盟BI示例图片,不具有现实数据意义)
利用BI统计的数据趋势就可以验证产品的活跃度是否增加了,还能知道用户是在产品内的路径,更清晰的了解用户使用道具功能后是否发布作品,用户查看作品时是否点击“道具主题”关键词进入主题页,从而停留时长更长,活跃度更高。
4.2运营策略
运营策略所面向的产品,通常也是有用户型和业务型,通常被熟知的都是用户型产品,判断标准是用户使用产品本身是不需要付费的,产品需要先做大用户,然后再从其他方面获得收益,所以用户型产品的利润通常是“羊毛出在猪身上”。
而业务型产品就不一样了,和传统行业一样,使用产品就需要付费,典型的有自营理财类产品,在于从业务本身要有利率差可以赚,如果利率差不高于业务运营所需成本,用户越多亏损越严重,业务型产品的羊毛必须要从羊身上薅出来。
不论是哪种类型的产品都需要数据驱动,做任何决策需要数据支持,绝不能一拍脑门就决定行动目标和方向。
比如以陆金服这款理财产品为例,陆金服虽然背靠平安银行,获客渠道更多,成本更低,但获客成本仍可以通过优化渠道投放来进一步降低成本,这时候渠道运营就要思考: 哪些渠道可以增加预算,哪些渠道可以放弃,哪些渠道适当维持正常预算?
(理财产品的常规获客模型)
拿到这样一个“分析渠道获客优劣”的命题,第一直觉是先深入了解渠道获客的全流程。
根据上图的“理财产品的常规获客模型”,可以明白理财产品一般是渠道投放和做分享拉新活动来获客,两者的落地页设计是不同的,渠道投放的落地页可以理解为是一个广告链接,写上吸引目标用户的文案,感兴趣的用户点击后直接跳转应用商店。
而社交分享活动的落地页含有注册协议,一般是领投资红包和加息券,用户填写手机号点击领取后就直接注册了该平台,随后点击使用优惠权利就直接跳转到应用商店了。
所以可见,社交分享拉新的注册流程是隐秘化的,一般来说注册转化率远远高于渠道投放的注册转化率,毕竟注册的发生路径短了很多。
随后,用户注册app后,就需要登陆产品了,如果用户未登录,那获客就失败了,毕竟对于业务型产品来说,注册并没有什么用户价值。
用户登陆之后,有一个很重要的权益是可以投新手标,新手专享具有期限短、利率高的特点,一般不允许叠加加息券和红包,如果允许叠加,那羊毛党是最喜欢的了。
新手专享标会有限额,对于大额投资人来说,他们可能会追投普通标,这样就可以认为这个用户留下来了;也有一部分用户在体验新手专享后,信任度提高了,新手到期后继续投资或追加投资,这部分用户也留存下来了,这些留存用户是分析渠道获客成本的主要力量。
更多的登录用户是放弃了投资,或者在新手到期后就取现离场了,同时留存的老用户中这部分也有到期或者债转取现的,同样的都是流失用户,那些已经发生投资行为的用户具有很高的激活召回价值。
鉴于讨论的是渠道获客质量的优劣,更多的内容就不展开了。继续深挖分析“如何衡量渠道获客质量”这个命题。
我认为想要衡量好坏就要给出一个可衡量的指标,并且以我的理解, 我觉得衡量理财产品的获客优劣的关键性指标是“渠道获客投入产出比” ,有些客户获取成本高,但是贡献的投资额更高,投资期限更长,获客的“投出产出比”就更高。
接下来将该指标公式化,可以衡量的指标才值得指导业务,所以得出:
渠道获客投入产出比=平均获客收益/平均获客成本,
平均获客收益=年平均投资额=客户累计投资额*投资期限/365,
平均获客成本=渠道累计投入预算额/渠道累计发生投资用户,
因此,渠道预算花销、渠道累计获得有效用户,有效用户累计投资额、投资期限这些数据就是衡量渠道获客优劣的核心数据。也是可以量化的数据,找到各个渠道来的用户在产品发生的该项数据,然后计算出各个渠道的“获客投入产出比”,数值越大则代表渠道获客质量更高。
以上可量化的数据在BI系统里也会相应的统计模块, 利用BI观察数据趋势,也可以把“获客投入产出比”这个指标定制化做入系统,这个层面的事情就很多元化了,不赘述。
(友盟BI示意图)
4.3数据分析心得
通过上述简单的两个互联网产品案例,我们可以发现,数据是非常宝贵的,可以说任何一家不注重数据保护和挖掘利用的公司都生存不下去。在解决工作中大大小小的问题时,数据是最直观最重要的依据。
想要做好数据分析,要从3个方面入手,第一是掌握数据分析方法。其中包括 工具 方法和分析思维;第二是深度理解业务逻辑,了解数据与数据、指标与指标之间的相关关系;第三是换位思考,站在需求方的角度去做分析,去解决实际问题,不要想当然的沉浸于自我的分析成果中,再漂亮的分析报告如果不能支持业务,不能作为做决策的依据,那它就是无用的。
总结
本文阐述了笔者对数据分析的一点认知,抛出了自己的数据分析三个原理,数据分析是一件说大也大,说小也可以小,本文的内容难以详尽这个领域,只希冀其中写到的数据分析思维和小案例能帮到你做一个合适的策略。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Spark SQL内核剖析
朱锋、张韶全、黄明 / 电子工业出版社 / 2018-8 / 69.00元
Spark SQL 是 Spark 技术体系中较有影响力的应用(Killer application),也是 SQL-on-Hadoop 解决方案 中举足轻重的产品。《Spark SQL内核剖析》由 11 章构成,从源码层面深入介绍 Spark SQL 内部实现机制,以及在实际业务场 景中的开发实践,其中包括 SQL 编译实现、逻辑计划的生成与优化、物理计划的生成与优化、Aggregation 算......一起来看看 《Spark SQL内核剖析》 这本书的介绍吧!