情趣内衣哪家强?| 大鹏教你玩数据

栏目: 数据库 · 发布时间: 5年前

内容简介:大家好,我是大鹏。月黑风高的夜晚,如果你的女朋友为你穿上了一件她精心准备的情趣内衣,你希望是成熟蕾丝风,还是清纯制服风?既然身为一名正经的数据分析师,当然用数据说话。我决定用情趣内衣数据看看,哪种“情趣”是大家的最爱,顺便达成在公司欣赏内衣模特的成就。

大家好,我是大鹏。

月黑风高的夜晚,如果你的女朋友为你穿上了一件她精心准备的情趣内衣,你希望是成熟蕾丝风,还是清纯制服风?

既然身为一名正经的数据分析师,当然用数据说话。我决定用情趣内衣数据看看,哪种“情趣”是大家的最爱,顺便达成在公司欣赏内衣模特的成就。 情趣内衣哪家强?| 大鹏教你玩数据

情趣内衣哪家强?| 大鹏教你玩数据

如何获得情趣内衣数据?

自己动手,丰衣足食, 八爪鱼 这款神器的逻辑和 python 爬虫类似,学习成本很低,鼠标点击即可批量获取网页数据。本次情趣内衣数据爬虫,将使用八爪鱼。数据分析部分将使用python。完整操作文件及代码见文末。

爬虫分为三步:

  • 第一步:爬取内衣列表页

使用八爪鱼内置的火狐浏览器访问内衣列表页,点击想要的数据,点击采集,就可以建立爬取任务:

情趣内衣哪家强?| 大鹏教你玩数据

选择好所有需要爬取的字段后,设置采集页数,点击“开始采集”,爬取程序自动开始:

情趣内衣哪家强?| 大鹏教你玩数据

利用鼠标点击,我在5分钟内爬取了3000+条情趣内衣列表页数据。包括列表页 上展示的店铺名、商品名、价格等信息。这批数据将在文末进行分享。

情趣内衣哪家强?| 大鹏教你玩数据

此外,我们还需要爬取每个商品详情页面的url,以进行第二步爬虫。这涉及到使用Xpath进行具体数据定位。 Xpath是一种在python爬虫中也通用的定位语言,具体写法我将在文末分享。

情趣内衣哪家强?| 大鹏教你玩数据

  • 第二步:爬取内衣详情页

详情页就是大家点进商品后看到的详细介绍页面。收集到详情页的url后,我们还可以爬取商品关键词、产地等信息。也可以爬取页面上同类商品的推荐,以研究情趣内衣的推荐逻辑。

情趣内衣哪家强?| 大鹏教你玩数据

在这个爬虫中,Xpath再次展现了其作用,定位“款式”“产地”等信息列表,在每一个页面中都是不一样的,因此,我们需要使用contain函数来定位包含有某个标签的数据:

情趣内衣哪家强?| 大鹏教你玩数据

这里使用了X中的contain函数,表示去定位一个标签中包含“店铺”关键词的标签,以此来定位店铺数据。

  • 第三步:爬取评论

这一步很简单,八爪鱼官方就有已经写好的任务,输入刚刚的详情页url,轻松搞定:

情趣内衣哪家强?| 大鹏教你玩数据

有了数据之后,我们就可以用python分析起来了~

情趣内衣哪家强?| 大鹏教你玩数据

情趣内衣哪家强?

  • 情趣内衣一般卖多少钱呢?

普遍来看情趣内衣都不贵,毕竟布料少,商家也不好意思卖太贵吧 情趣内衣哪家强?| 大鹏教你玩数据 。大部分情趣内衣的价格都在10到75元之间。

情趣内衣哪家强?| 大鹏教你玩数据

  • 人气高的情趣内衣是哪些?

用评论数量来表示人气,可以看到评论最高的梯队评论已经超过20w。和价格区间进行对比,我们可以确定 10元到70元之间的内衣容易出爆款

情趣内衣哪家强?| 大鹏教你玩数据

说到人气,我知道你肯定想看看排名前十的情趣都是哪些 情趣内衣哪家强?| 大鹏教你玩数据

情趣内衣哪家强?| 大鹏教你玩数据

排名前十的商品基本都是透视蕾丝风格的内裤。他们都来自同一家叫 霏慕 的店铺,评价均超过了21w。如果不是店家刷单,那么说明透明蕾丝就是大家心中的挚爱!

  • 情趣关键词有哪些?

情趣内衣哪家强?| 大鹏教你玩数据

情趣内衣哪家强?| 大鹏教你玩数据

“制服诱惑”“性感套装”“透明丁字裤”……从营销角度来说,商家会在商品名中加入很多搜索关键词以提高自己商品被搜索到的概率。从词频结果来看,性感诱惑成熟的形容词是大家都爱搜索的。而像我这样的清纯党只是小众。 情趣内衣哪家强?| 大鹏教你玩数据

买情趣内衣的人怎么说?

情趣内衣哪家强?| 大鹏教你玩数据

可以看到,买家对商品评价偏向正面。质量不错、满意喜欢、物流很快是大家都会表扬的优点。这也是做电商的商家必须把握的三个要点。

其中有一个有趣的点。“老公”这个词出现的频率排到了第十。一般来说女生才会在评论里写到“老公”这个词,那么:

  • 男性和女性谁更爱买情趣内衣?

我们挑选了评论中包含“老公”“男票”“男朋友”等字样的用户,视为女性用户;和评论中包含“老婆”“女朋友”“女票”等字样的用户,视为男性用户,将两者数量进行对比:

情趣内衣哪家强?| 大鹏教你玩数据

可见在情趣方面,女性是更会玩的。毕竟情趣内衣基本只有女款,涉及到自身形象的问题,女生们还是普遍选择自己动手。

手把手教你玩情趣

情趣内衣这个数据脑洞,最初也是来源于数据团的一位学员。当你有一个脑洞的时候,如何才能转化为有趣的内容呢?数据分析也许是一个方向。给我一小时,我带你入门:

情趣内衣哪家强?| 大鹏教你玩数据

大鹏教你玩数据是一个系列教程,用有趣的主题讲好数据故事,主题还包括:

  • 十年票房数据爬取与分析 (已更新)

  • 哪个景点人少又好玩 (已更新)

  • 女朋友每天都在水逆,数据告诉你星座的秘密 (已更新)

  • 工作职责描述到底是什么意思?就业数据指南(待更新)

  • 全职高手人物关系指南(待更新)

  • 那些铁路覆盖不到的地方究竟是哪里?(待更新)

主题将不断更新中,快扫海报上的二维码,关注公众号  大鹏教你玩数据 ,回复“ 情趣 ”,获取上课地址吧。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

小团队构建大网站:中小研发团队架构实践

小团队构建大网站:中小研发团队架构实践

张辉清 等 / 电子工业出版社 / 2019-1 / 69

《小团队构建大网站:中小研发团队架构实践》结合作者近几年的工作经验,总结了一套可直接落地、基于开源、成本低、可快速搭建的中小研发团队架构实践方法。《小团队构建大网站:中小研发团队架构实践》共5篇22章,开篇是本书的导读;架构篇是设计思想的提升,包括企业总体架构、应用架构设计、统一应用分层等;框架篇主讲中间件和工具的使用,包括消息队列、缓存、Job、集中式日志、应用监控和微服务等;公共应用篇是技术与......一起来看看 《小团队构建大网站:中小研发团队架构实践》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具