我的二手车究竟值多少钱?

栏目: 编程工具 · 发布时间: 6年前

编者按:本文来自微信公众号“ DT数据侠” ,作者Anthony Parrillo。36氪经授权转载。

也许你曾尝试卖掉一辆车,却发现无法得到你想要的价格;也许你曾尝试买一辆车,结果却发现价格贵得离谱;又或者,你以理想的价格买到了一辆车,却发现这车有许多乱七八糟的表面看不到的问题。

在这个网络爬虫的项目里,我尝试分析二手车的价格到底受什么因素影响。我爬取了Carfax网站。用户可以在上面查询一辆车的过往历史,以避免买到有问题的车。

我使用Selenium爬取了符合下面条件的车的url网址:首先,在纽约市周边50英里内售出;其次,价格低于15000美元。

在收集到全部url后,我使用scrapy来进一步收集了每个车的具体信息。收集到的价格指的是经销商的售价,不是现在的市场价格。由于时间维度的限制,我一共爬取了6747辆二手车的数据。

我对数据进行了一些分析。首先,我做了一个价格和年代的散点图。

我的二手车究竟值多少钱?

然后是一个价格和年代的箱线图。

我的二手车究竟值多少钱?

以及一个价格和年代的柱状图。

我的二手车究竟值多少钱?

我好奇2015年时,为何价格随年代上升而下降的趋势没有延续。在研究每年的汽车清单数时我发现了有趣的事情。

我的二手车究竟值多少钱?

因为许多车是出租3年再交回的,所以车龄在3年的被出售的车的数量高出很多。这可能是2015年价格高出其他年份的一个原因。转卖二手车另一个重要的影响因素是里程数。下面是一个出售汽车按里程数分类的直方图。

我的二手车究竟值多少钱?

价格与里程数关系的色码图(hex chart):

我的二手车究竟值多少钱?

当比较生产商时,由于此前的过滤条件设定在低于15000美元,所以呈现出朝奢侈品牌的偏斜。下面的图显示了各个生产商的转卖价格的分布。

我的二手车究竟值多少钱?

下面是不同车型的价格分布。

我的二手车究竟值多少钱?

对于那些在乎环保的用户,这是一个不同动力类型的车的价格分布。

我的二手车究竟值多少钱?

不同动力传送系统的分布:

我的二手车究竟值多少钱?

我使用双样本t检测比较了自动挡和手动挡的购买价格,看一看两者的平均值是否在统计学上意义上有不同。它们在统计学上确实不同。自动挡的比手动挡平均贵了1300美元。

我的二手车究竟值多少钱?

许多人关心购买的车的文件(title)上记录的状况。一个有趣的比较是那些没有事故记录的车和有过事故的车:

我的二手车究竟值多少钱?

很明显,没有事故记录会给价格带来很大影响。双样本t检测显示,平均值上的差距在1150美元。

最终,基于所有数据,下面是各款车型的二手转卖价格数据分布:

我的二手车究竟值多少钱?

一些简单的结论包括:自动挡比手动挡贵出1300美元;没有事故历史的二手车比有事故历史的贵1150美元;箱式轿车比其他车型的二手车卖的好等。

这些结果不仅对于那些想要购买二手车的人有参考价值,而且也对想要买新车的,纠结于买车还是租车的,以及考虑是否要卖掉现在有的车的人有价值。

注:本文编译自数据博客《How much is my used car worth?》。内容仅为作者观点,不代表DT财经立场。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

MySQL入门很简单

MySQL入门很简单

黄缙华 / 清华大学出版社 / 2011-1 / 59.50元

《MySQL入门很简单》从初学者的角度出发,由浅入深,循序渐进地介绍了mysql数据库应用与开发的相关知识。书中提供了大量操作mysql数据库的示例,还提供了大量实例和上机实践内容,供读者演练。《MySQL入门很简单》附带1张dvd光盘,内容为与《MySQL入门很简单》内容完全配套的多媒体教学视频和《MySQL入门很简单》涉及的源代码。 《MySQL入门很简单》共分5篇。第1篇介绍数据库的基......一起来看看 《MySQL入门很简单》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

html转js在线工具
html转js在线工具

html转js在线工具