从产品角度看大数据01

栏目: 编程工具 · 发布时间: 8年前

内容简介：从产品角度看大数据01

一.大数据是什么？

大数据简单的理解就是很多很多的数据，很多很多种类型（用户人工判断不出或者无法判断，但实际这些数据是相关的）如何发现和利用这些数据间的相关性才是大数据应用的核心。

大数据分析：对规模具大的数据进行分析，是一个发现问题、提出假设、印证猜想、不断优化的过程。

二.如何利用大数据，让大数据发挥价值？

大数据我是有了，要怎么利用它们？

一切不谈具体应用场景的大数据都是耍流氓。

三.实例解读大数据的应用。

今日头条

你关心的，才是头条！

介绍今日头条的个性化推荐机制（简介+分析）

个性化推荐机制，7亿人有7亿种不同的头条，最大化保证推送的精准度，尽量保证对的文章推荐给对的人——归根到底这个推荐算法关键是还在于对海量用户行为的数据分析与挖掘，通过对海量数据的深度挖掘，今日头条不仅能够为每一个人按兴趣推荐信息，还能够从宏观的角度得到大众群体的阅读趋势。

今日头条它这个平台的用户有什么特点。这个也十分重要，就是你首先要了解它，才能知道怎么去搞定这批人，这批人需要什么。

用户在通过社交账号登陆时，算法会解读用户兴趣，形成用户画像，根据用户画像来推荐感兴趣的文章。在用户使用过程中，算法会根据用户的点击、搜索记录、订阅等行为优化用户画像。

冷启动

拿我的微博dandan米娜接入今日头条后，系统后台便会对我的兴趣作出分析，建立初始的DNA数据，并根据这些兴趣的权重来进行推荐。当然，因为这只是第一步，所以我们称之为冷启动。

所以，在冷启动的基础上，随着用户行为数据的积累，系统为每个用户建立的兴趣模型就越精确，你会感觉到这款产品越来越懂你，这也是所有个性化推荐系统的基本原理。

根据其社交行为、阅读行为、地理位置、职业、年龄等挖掘出兴趣。通过社交行为分析，5秒钟计算出用户兴趣；通过用户行为分析，用户每次动作后，10秒内更新用户模型。这些用户行为数据会实时性地被传送到后台

如果用户不登录，头条会推荐一些大众化的内容，再根据用户点击（反馈）来确定用户画像。

文章经过审核和消重后，会分批次推荐给用户。

首先推给最感兴趣的用户，然后根据这批用户的反馈信息决定下一批的推荐量，反馈信息包括 点击率、收藏数、评论数、转发数、读完率，页面停留时间等 ，其中，点击率占的权重最高。

首轮推荐后，如果点击率低，系统就认为文章不适合推荐给更多的用户，会减少二次推荐的推荐量；如果点击率高，系统则认为文章受用户喜欢，将进一步增加推荐量。

以此类推，文章新一次的推荐量都以上一次推荐的点击率为依据。

而今日头条是 一款基于机器学习的个性化推荐引擎 ，其基本逻辑主要有两条：

第一，用户使用App越多时，发生的动作类型就越多，如用户的互动、阅读内容的数量、速度及场景等。通过这些动作收集而来的数据能够完整的描述用户画像，就像医生见到病人后从各个角度进行观察，并把其特征描述地很细。当细化的描述形成有结构的表格后，今日头条就能 “认识” 每一个人 。然后再以同样的方法 “认识” 每篇文章 、 每个关键词 后，系统就能够让他们在向量空间中拥有各自的位置，并通过算法进行匹配。当匹配度越高的时候，系统就认为这是该用户最想得到的信息，并进行推送。

第二，用户可能之前没有足够的历史信息提供给数据库。（模型匹配）这种情况就需要第二条逻辑来为他们提供感兴趣的信息，即 “越多的人用越懂你” 。即便用户对推荐引擎来说是陌生的，但总会有相同特征的用户，比如使用苹果手机的男性、三十到四十岁年龄之间等人群画像是系统已经了解过的。它可以据此对类似人群进行解读，把用户最可能感兴趣的信息推送过去。因此，每个人的头条都是不一样的，即 “你所关心的才是头条” 。按照以上两条逻辑，对文章和用户的匹配和连接对象进行了更细化的拆分。今日头条的推荐引擎按照关键词和分类先把文章分到具体的特征向量中，再对用户进行定位，并分配到具体的特征向量中。最后将这两者进行匹配，按照推荐引擎学习到的算法，把不同的信息推送到每位用户。

在整个推荐过程中， 受众也会对文章进行反馈 。对于反馈信息，会把它沉淀下来放到媒体实验室，而 媒体实验室 就是对今日头条后台数据进行提取和分析的数据产品。但媒体实验室现在最主要的功能就是来促进创作、服务创作者，用数据来告诉创作者，目前的内容的潮头在哪里？他们写什么样的东西可能会受欢迎？受众是什么样子的？等等。

网易云音乐

2013-2017。截至目前用户量突破3亿。优势在哪里～

场景：很多用户打开音乐播放器一脸懵逼，不知道要听啥才好。

现在主流都是通过机器学习的方式，通过同类人类的偏好给相似的人群推荐他们都喜欢的歌曲。

初始化用户画像口味，（根据用户个性标签及时推荐）在网易云音乐你有一千种发现好音乐的方式。网易云的每日歌曲推荐和私人FM推荐的歌曲都很懂你，你喜欢听什么，它都知道，很人性化。

个性推荐：私人FM+每日歌曲推荐+云音乐热歌榜（自定义调整／排序位置／是否显示）

精准的个性化推荐离不开强大的数据支撑

四.我们该如何让大数据来驱动产品。

如何利用数据驱动产品设计？

数据驱动的产品（data-driven products）

从产品角度出发，大数据可以为产品经理提供产品迭代的数据支持。通过数据来描绘出 用户画像

循环模式：

在循环的过程中，收集到了一定程度就会形成固化规律，推荐也就愈加的准确（越用越懂用户），用户体验提升，用户粘性提升。

我们通过采集数据，可捕捉视频平台／OTT盒子的用户交互行为，并向内容创作者提供详尽的分析报告，帮助他们对重要的指标做出优化（参与率、播放率、转化率等），帮助我们实现智能个性化的推荐，提高用户体验，留住用户。

1.用户行为分析

行为分析／漏斗分析／留存分析／回访分析／用户分群

数据驱动运营

合适的方法是要经过不断的实验去验证，验证的过程也是在校验数据，从而优化运营策略，提升用户新增和留存。

参考资料：

艾瑞咨询：2016年中国数据驱动型互联网企业大数据产品研究报告（附下载）http://www.199it.com/archives/549938.htmlhttp://www.36dsj.com/archives/73538

今日头条的文章推荐机制及运营规则 https://150643.com/414.html

数据挖掘系列篇（9）：今日头条的个性化推荐https://zhuanlan.zhihu.com/p/20501759

dandan米娜： 一枚快乐的产品喵，爱生活、爱微笑、爱分享，努力学习成长ing~

（来源：www.jianshu.com，如对本网转载内容、版权有异议，请联系我们: hiapknews@baidu.com）

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

赛博空间的奥德赛

(荷兰)约斯·德·穆尔 (Jos de Mul) / 麦永雄 / 广西师范大学出版社 / 2007-2 / 38.00元

本书揭示了数码信息时代的电子传媒与赛博空间为人类历史的发展提供的新的可能性。本书第一部分“通向未来的高速公路”，涉及无线想象、政治技术和极权主义在赛博空间的消解等题旨；第二部分“赛博空间的想象” ，讨论空间文学探索简史、电影和文化的数码化；第三部分”可能的世界” ，关涉世界观的信息化、数码复制时代的世界、数码此在等层面；第四、五部分探讨主页时代的身份、虚拟人类学、虚拟多神论、赛博空间的进化、超人文......一起来看看《赛博空间的奥德赛》这本书的介绍吧!

码农工具

图片转BASE64编码

在线图片转Base64编码工具

RGB CMYK 转换工具

RGB CMYK 互转工具