内容简介:基于用户画像的商品和服务能够提升平台服务体验并促进服务的个性化、精准化实现,本篇文章为大家详细地讲解了如何运用AI技术构建用户画像。
基于用户画像的商品和服务能够提升平台服务体验并促进服务的个性化、精准化实现,本篇文章为大家详细地讲解了如何运用AI技术构建用户画像。
在帮独角兽企业做产品咨询顾问工作的过程中,多有CEO说:“诗路我要买数据,哪里有卖数据的,我想用我2千万用户的手机号去碰撞数据”。
我常问您要用手机号碰撞数据,碰撞出来的用户偏好还是第三方的,也不是您平台的用户行为,更不能在你的场景业务形成交易落地。然后CEO们会追问诗路:“您说我该怎么做?还有我的产品经理不懂AI,格局不够,您看我要换吗?”。
本文就以上问题,如何实现AI背景下的用户画像,以及如何看待所谓的“产品经理的能力下滑”等两方面问题做出实践回答。通过实现AI助力的用户画像产品经理就不在仅仅是个只知道用户画像、标签、属性、表的概念,而是能够带领团队以身作则实现产品的需求,进而赢取用户。
第一个方面:运用AI技术构建用户画像
大数据和AI技术的发展驱动着商品和服务向着个性化、精准化方向发展。基于用户画像的商品和服务能够提升平台服务体验并促进服务的个性化、精准化实现。
用户画像又称用户角色作为一种勾画目标用户、联系用户诉求与设计方向的有效 工具 用户画像在各个领域得到了广泛的应用。目前由于用户画像能够精准、快速地分析用户的行为习惯、需求意愿为商品和服务提供重要的数据基础因此基于用户画像的个性化推荐商品和服务系统已经走上产品舞台的中央。淘宝为构建用户画像给一个用户的标签维度数量高达2W以上。
在构建用户画像这段会运用大数据技术、语义网技术和AI技术将平台的商品和服务各种类型资源信息构建为基于语义关系的、具有复杂关联网络的知识图谱并开展以知识图谱为基础的智慧化、个性化商品和服务。
用户的浏览、交易行为全部能够映射到知识图谱之中通过用户行为在知识图谱中的全部映射参考用户所在行业和领域的群体行为在知识图谱中的映射即可建立平台的用户画像。
第一步:用户画像建模
对于一个商品和服务平台中的用户画像的建模主要通过获取用户的浏览行为背景、交易情况、相似用户需求趋向相关的信息并将这些信息进行模型化表示从而提取出用户需求偏好和趋向。
用户的性别、年龄、公司、学历等静态数据构成了用户的基本信息。用户交易信息、浏览信息、订单信息、检索、下载、收藏、点赞、网络环境切换等动态行为轨迹构成了用户行为历史数据。
用户所属的行业和领域的群体行为轨迹又给个体用户提供了行业背景的动态模型。将这些静态数据和动态数据分为用户基本信息、用户浏览历史、用户行业背景3类,每个类别包含多种不同的用户行为轨迹这些共同构成了用户画像层次模型见下图:
在这3类模型标签的基础上进一步确定预测标签可归纳为:用户属性、用户关注的商品和服务、用户偏好的商品和服务。
这3种预测标签可进一步指导用户在商品和服务平台上设立用户个性化服务空间甚至是C2M的客制化电商模式按照用户的属性、用户的关注领域和用户偏好分别推送典型的商品和服务资源。
第二步:运用层次分析法决策
层次分析法(Analytic、Hierarchy、ProcessAHP)是将与决策有关的元素分解成目标、准则、方案等层次在此基础上进行定性和定量分析的决策方法。
运用层次分析法首先要建立递阶层次结构然后构建判断矩阵、计算权重值并分析决策过程。
(一)建立递阶层次结构
在上面LineLian图所示的层次结构中个体用户画像S是目标层定义模型最终需要解决的问题用户基本信息T1、用户浏览【埋点】信息T2、用户行业偏好背景信息T3是准则层定义使用方案层的方法是解决目标层的问题所需要的中间环节其中T3又进一步细分为用户群体画像U10和群体标签画像U11性别U1—点赞、收藏、分享U9以及重点机器埋点交易V1—点赞、收藏、分享V10是方案层定义了为达到目标层的定义而采用的方法和措施。
(二)构造两两比较判断矩阵
构建判断矩阵的过程就是对因素之间的重要程度进行量化的过程。判断矩阵采用1一9量化指标构造用户属性相对矩阵。构造同层次因素间的判断矩阵计算出矩阵的最大特征值及其特征向量并进行一致性检验。
构造两两比较判断矩阵时可以由产品+行业领域专家对全局统筹把握将两两因素之间的重要性分为同等重要、稍微重要、明显重要、强烈重要以及极端重要5个等级并且用相应的数字进行标注。
例如,对LineLian图中的个体用户画像S来说用户基本信息T1、用户浏览历史【埋点】信息和用户行为偏好信息T3的两两比较判断矩阵S为:
S=【1 1/5 1/3 5 1 2 3 1/2 1 】
计算矩阵的最大特征值和特征向量其中特征向量对应着不同因素的排序。AHP对判断矩阵是否具有完全一致性提出了数学化的指标:一致性指标C.I.(ConsistencyIndex)。AHP认为C.I.反映的是判断矩阵偏离一致性的程度C.L值越大该矩阵偏移一致性的程度就越大反之越小。C.J.=λ-n/n-1C.I的值越大矩阵的不一致性越严重其中λn为判断矩阵S的最大特征根。
为了衡量n与一致性的关系AHP引人了平均随机一致性指标R.I.(Random Index)。R.I是与n相关的离散函数不同的n值对应不同的R.I。
AHP利用这两个衡量判断矩阵一致性的指标:C.I.和R.I.引人了第三个指标——随机一致性比率C.R.(ConsistencyRatio)。C.R=C.I/R.I当C.R<0.1时认为矩阵具有满意的一致性反之则要重新构造矩阵直至满足C.R<0.1为止。
(三)计算权重值
将各因素的两两比较判断矩阵权重与上一层次因素指标权重相乘从而计算出这个因素指标权重的合成。如:分享商品或服务页面合成权重=用户浏览历史权重X分享页面权重以此类推计算出各项指标的合成权重。
小结:分析决策
经过以上三个步骤,就可以根据建构的问题模型得到相应的底层因素的权重值。再通过分析、比较将数学判断与专家决策人的相关经验相结合最终即可形成决策方案。
第三步:用AI技术中的知识图谱-基于向量空间模型的用户画像
用户画像能够表示用户对商品和服务相对稳定的兴趣需求它反映了用户在一段时间内对商品和服务资源需求的主要倾向。随着用户交易行为的按照时间序列的记录和用户反馈的修改用户画像不断地动态调整。
用户画像对用户商品和服务兴趣的表达主要有3种方式:概念表示法(如轻食、文创)、关键词表示法(莫斯利安、全家、拿铁、脏脏包)和向量空间模型表示法。基于AI项下知识图谱的用户画像是采用向量空间模型表示法来表示用户对商品和服务偏好与倾向的。
(一)向量空间模型
向量空间模型由Gerald Salton等在20世纪60年代提出并成功地将其应用于著名的SMART文本检索系统。他是把对文本内容的处理简化为向量空间中的向量运算并且他以空间上的相似度表达语义的相似度直观易懂。当商品被表示为商品空间中的向量就可以通过计算向量之间的相似性来度量商品间的相似性。文本的处理方式中最常用的相似性度量方式是余弦距离。
若把商品表示为商品空间中的向量则首先要假设商品中每个字或图在商品中的作用是相互独立的。根据贝叶斯假设商品可以由其中的字或图的集合代替这些字和图即被称为商品的特征项。
设商品d1中的特征项为ki其权重用wij表示则确定值的最常用的 算法之一是TF-IDF方法 。其中TP(词频)表示关键词在文档中出现的频率。其是对词数(Term Count)的归一化防止它偏向长的文件。对于在某一特定文档d1中的关键词ki来说它的重要性可表示为:
TFij=fij/∑(h)fh+j (1)
其中,f ij 表示关键词ki在商品d1中出现的次数,∑(h)fhj表示商品dj中所有描述词语出现的次数之和。
IDF(逆向文件频率)是对一个词语普遍重要性的度量。某一特定词语的IDF可以由总文件数目除以包含该词语的文件的数目加1再将得到的商取对数得到。
IDFi=㏒N/1+ni (2)
这样利用TF-IDF算法得到的关键词ki的权重就可以表示为
Wij=TFij*IDFi (3)
(二)向量空间模型表示的用户画像
在用户画像层次模型中用户的浏览历史和用户的标签偏好背景中的各项指标都可以借助向量空间模型来表示。个体用户LineLian的终端机器交易、小程序交易、检索数据库、浏览网页、点赞、收藏分享等网络行为群体用户的终端交易、小程序交易、检索数据库、浏览网页、点赞、收藏分享等网络行为轨迹可以根据用户浏览历史活动列表来表示。
例如用户LineLian购买了m份麦隆咖啡那么用户LineLian咖啡品类的向量空间模型Tj={<kj1wj1><kj2wj2>…<kjmwjm>}由<词,权重>对组成。
利用层次分析法可以计算出这些类别商品运营活动的各项指标的合成权重值,例如:分享某商品合成权重=用户浏览历史权重X分享商品权重。由用户LineLian的分享商品的向量空间模型Tj中的各项词向量权重值wjm X分享商品合成权重值就可以得到用户LineLian的分享商品的用户画像的向量空间模型TDj。
以此类推计算出用户LineLian各项商品运营活动的用户画像向量空间模型。
(三)时间上下文【时间序列】
在分析用户的历史浏览行为时时间是一种重要的上下文信息。一般认为用户最近这段时间的浏览行为的权重要高于用户早期的浏览行为的权重因此我们将时间上下文因素考虑进来。
将时间序列因素融合到用户的兴趣模型中的方法。用f(t)表示时间衰减函数,代表每次商品运营行为所占的权重,f(t)的公式为:f(t)=1/1+α(T-t),其中α为时间哀减参数T表当前时间t表示用户发生该商品分享行为的时间T-t表示用户该分享行为发生至今的时间长度单位为天f(t)表示经过了T-t时间段衰减后的值其取值范围是0~1f(t)随着时间差值的增大而减小且减小的速率越来越小。
融合了时间上下文因素后用户LineLian各项商品分享活动的用户画像向量空间模型中的每一个词向量的权重值都要乘以发生这一行为对应的时间衰减函数f(t)才能得到该用户的融合了时间上下文的用户画像向量空间模型。
(四)群体用户画像
在建构用户画像层次模型时将用户的行业和偏好背景因素也看作用户的一种属性特征而行业背景和偏好背景也是可以通过该行业所有用户的历史浏览轨迹来表示的。因此在用户画像的构建中实际构建了群体用户画像和个体用户画像两种模型。
在构建群体用户画像时属于这个群体的每一位个体用户的各类历史浏览行为都参与了这个群体的对应类别的群体画像因素合成。例如某一行业白领有n位用户用户LineLian分享商品的用户画像的向量空间模型为TDj则这一商品用户群体分享商品的用户画像的协同向量Pj=<LineLian1LineLian2…LineLiann>。
以此类推计算出所有用户群体的各项商品的群体用户画像向量空间模型。
群体用户画像中各类别商品服务的各项指标在整个用户画像中本指标所占的权重值也可以通过层次分析法来计算获得。例如:某类目商品被分享合成权重=某类目用户分享商品历史权重X某行业分享权重由该专业用户LineLian的分享的向量空间模型Tj中的各项词向量权重值wjmX某类目行业分享合成权重值就可以得到该专业用户LineLian分享某商品的用户画像的向量空间模型TDj。
同样群体用户画像也要融合时间上下文因素。用户LineLian各项交易点赞收藏分享活动的用户画像向量空间模型中的每一个词向量的权重值都要乘以发生这一行为对应的时间衰减函数f(t)才能得到该用户的融合了时间上下文的用户画像向量空间模型。
(五)用户画像的分类
在实际运用用户画像来预测用户的购买需求和行为时要考虑不同类型的商品和服务资源所具有的特点。服装、文创类的资源内容具有很强的时效性、具体性、专业性而食品、轻食饮料的内容具有一定的基础性、系统性、普遍性。
因此对于食品、轻食饮料的推荐策略与对服装、文创资源的推荐策略应该是不同的。对食品、轻食饮料的推荐应该以个人及群体的交易记录和复购书记录为主参考而服装、文创等资源的推荐策略则应该以个人检索、浏览、分享、点赞、收藏的记录为主参考同时参考关注过相关主题的其他用户的记录。而关注过相关主题的其他用户的记录可以采用协同矩阵来分析。
设n个用户的阅读历史表示为矩阵M:
M=【θ11 θ12 …θ1m θ21 θ22 …θ2m … … … … θn1 θn2 … θnm】
其中M是nXm维矩阵每行代表特定用户的分享(或者检索、浏览、收藏)历史每列代表特定商品被分享(或者检索、浏览、收藏)的记录矩阵中元素在{01}中取值。如θjp=0代表用户LineLian没有分享过商品Ap(p=12…m)而θjp=1代表用户LineLian已经分享过商品Ap。
根据矩阵M中的行向量使用余弦相似度方法计算用户之间的相似度值其公式如式(5)所示:
Simab=(p=1 …m)∑θap*θbp/‖Ma‖.‖Mb‖ (5)
其中Simab表示用户LineLian与用户Line之间的余弦相似度值Ma=〈θa1θa2…θam〉表示用户LineLiana(a=12…m)的浏览历史;Mb=<θb1θb2…θbn>表示用户Lineb(b=12…n)的阅读历史;‖Ma‖和‖Mb‖表示欧氏距离。
根据式(5)计算出与用户LineLian相似度值超过某一阈值的用户定义为用户LineLian的相似用户组成协同向量Pj=<linelian1linelian2…>。
由此同一位用户的用户画像在实际应用时可以分类为两个不同的模型一个模型用来计算食品、轻食饮料的具体SKU个性化兴趣趋向另一个模型用来计算服装、文创的行业个性化趋向。这些用户画像的构建就为商城提供用户个性化资源推荐的服务奠定了数据基础。
第四步:用户画像本体的构建
上面讲了运用向量空间模型来构建用户画像得出了用户画像的向量空间模型它是一个向量词及词频的集合。对比于个性化的用户画像一般商城平台运用大数据技术、语义网技术和人工智能技术将商品库的各种类型信息资源构建为一个基于语义关系的、具有复杂关联网络的、由领域本体扩展的知识图谱。
这个知识图谱中的概念囊括了用户画像中的所有高频向量词并且这个知识图谱中与用户画像中的高频向量词对应的概念之间还建构了基于语义的复杂知识关联。
因此用户画像的向量词可以在领域知识图谱中找到对应的概念反之从领域知识图谱中抽取与用户画像相关的概念并映射到用户画像的向量词之间就构建了个性化的用户本体这个用户本体用来表示用户的偏好画像从而形成用户画像结构图。
第五步:领域知识图谱的建构
下面我们借用知识图谱的技术构建用户画像知识图谱,是将商品库、商品评价、用户会话文本作为命名实体识别的对象,然后按照知识图谱构建的技术流程。
第六步:综合建立知识图谱与用户画像的映射
第一部分:基于AI知识图谱的用户画像的优势:
相比于传统的标签式用户画像将知识图谱引入到用户画像中,不仅可以增强关键词向量中关键词之间的相关性还可以为个性化知识服务系统的用户建模提供一个新的研究方向:建构用户画像知识图谱。
用户画像的知识图谱是一种基于领域知识图谱的用户模型通过对领域知识图谱进行映射获取用户画像知识图谱利用领域知识图谱中的概念来对应用户画像中的概念并通过对用户的搜索、分享、浏览、收藏、点赞等过程进行分析不断完善用户画像的知识图谱实现用户个性化推荐商品或服务。
第二部分:产品经理能力下滑及应对策略:
又到了一年一度的圣诞时节也是各个公司加班加点工作的时节。有CEO兼产品经理问笔者:“有哪家咨询公司可以为上市 10 年的品种做产品营销策略和市场活动的规划报告?”“这应该是产品经理自己做的呀为什么找外人呢?”笔者LineLian第一反应是这句话。
“现在做产品经理太难了。老板要求我们写的产品计划既要囊括2018又要兼顾2019既要尊重迭代功能还要迎合创新。我们想了半天决定找您来做您的水平比我们高看看搞出来的东西到底怎么样。”他们说出了本意。
最近,有种声音说:“如今产品经理的水平与 10~20 年前相比似乎有下降趋势。”
原因有客观的外部因素也有主观的内部因素。先说 客观环境因素 :
第一,信息传播途径大变样。之前的产品经理多来至于行业专家,自从有了人人都是产品经理这一概念之后,大家觉得没工作的就可以干产品经理。
第二,行业的关注点大变样。之前产品经理定产品的方向,产品营销策划的战略,现在的产品经理是告诉他做一个具体功能。实现具体的需求。
第三,科技网络行业政策变化快从PC互联网到移动互联网再到物联网人工智能,就连公司本体都没有反应过来,关门的关门倒闭的倒闭。更别提为了生存的产品经理没适应了。
再讲主观内部因素:
第一,在每个人都似乎可以做产品经理的渲染下,产品经理人职背景两极分化。一种是要求高学历硕士博士毕业、MBA这类人士专业化知识不容置疑与专家打交道时谈笑风生但做出来的计划不接地气开发人员难以理解执行大打折扣。另一种是各个学院应届毕业生之前没做过没有经验但“照猫画虎”能力强PPT 专业漂亮可开发人员多以 “需求不清晰”为借口对其制定的产品策略置若罔闻。
第二,工作积极性得不到有效激励。国内老板总认为产品经理能力无法量化考核以产品版本迭代次数、功能板块为依据有“不看功劳看苦劳”的嫌疑。因此制定的工资方案无法激励产品经理真正有能力的人会跳走。
第三,产品经理能力提升紧迫感不够足。每年也安排几次外出参加培训或者请人做内训之后呢?很少有管理者意识到如何将这些知识点合成为公司独具特色的样本并且有效评估产品经理技能在考核中有效区别对待混日子与竭尽全力、悟性差与有灵性的产品经理。
分工太细所致:
LineLian很欣赏这种说法:产品运营既是 Science 又是 Art对市场的洞察既靠 Data也要凭 Sense乃“理智与情感”的协调统一不能偏废。
如今做产品AI、大数据似乎不缺每个SKU的销售额、市场份额数据都很容易获取依据这些数据分析出的报告、文献每天都在更新产品经理可检索到的资料、信息更是丰富多样为什么大家会认为产品经理的专业水平有下降趋势呢?
其中一个原因或许是分工所致。从前大多数公司的一个或几个品种由一个产品经理负责看文献、做 PPT、沟通专家、写计划、做运营活动都是一个人现在大多数产品这些事务由几个产品经理各自去做。如此产品经理个人显示出来的水平仅限于局部整体评价当然不如移动互联网刚兴起那会威风八面。
当然在当前状况下产品经理如何做出C位也不是没有机会。笔者LineLian建议两手抓,一手抓产品观点,培养产品方向Sense。例如,前天帮一家CEO做产品顾问,CEO说您看看OFO和共享单车这个赛道一塌糊涂,您看看瑞幸咖啡门店几个人完全不如一点点的排队情况。您再看看锤子手机快玩完了。
最后:我问了这位CEO一句话:“您看到这些产品的共性是什么?”,他说:“你说说看”,我说:“这些产品的共性是没有抓住极简,均知道做加法不知道做减法,当年锤子有17亿现金在手,老罗说要一年发布4部手机,老年机、少女机、儿童机等等,瑞幸是没有想透彻究竟是先做好线下门店还是线上”。
另外一方面要抓细节,谁说产品经理不能懂技术了?谁说产品经理和开发是天敌了?产品经理要懂细节,产品的细节包含技术的实现最好都懂,但不一定自己有时间写而已。
所以,无论AI技术多么复杂,算法有多么深不可测,我们要做的事是针对需要的算法驾轻就熟,平日训练有素做一个有深度的产品经理,难时上战场迎艰攻难。然后输出的产品目标只有一个:简单到无法再简单,简单到无法被超越。就能做到应对寒冬,AI才能助产品无惧未来!
#专栏作家#
连诗路,公众号:LineLian。人人都是产品经理专栏作家,《产品进化论:AI+时代产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多交流。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
以上所述就是小编给大家介绍的《AI产品再出发:给产品和CEO们的建议!》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
我知道他想看什么
沙建军 / 中信出版社 / 2018-1 / 48.00
社交媒体迅速发展、信息快速迭代、时间碎片化;大数据、智能终端、物联网横空出世;移动支付、网红经济和传统营销失效,这些都让这个时代的媒体、内容、渠道、产品之间的边界越来越模糊,也从根本上改变了营销的逻辑,内容营销从热词变成趋势,变成营销的底层思维。未来一切都是媒体,形式也是内容。 本书作者通过对国内外36个内容营销的新近案例的故事化描述和透彻分析,提出“组织媒介化”“营销内容化”“内容情趣化”......一起来看看 《我知道他想看什么》 这本书的介绍吧!