我的二手车究竟值多少钱?

栏目: 编程工具 · 发布时间: 6年前

编者按:本文来自微信公众号“ DT数据侠” ,作者Anthony Parrillo。36氪经授权转载。

也许你曾尝试卖掉一辆车,却发现无法得到你想要的价格;也许你曾尝试买一辆车,结果却发现价格贵得离谱;又或者,你以理想的价格买到了一辆车,却发现这车有许多乱七八糟的表面看不到的问题。

在这个网络爬虫的项目里,我尝试分析二手车的价格到底受什么因素影响。我爬取了Carfax网站。用户可以在上面查询一辆车的过往历史,以避免买到有问题的车。

我使用Selenium爬取了符合下面条件的车的url网址:首先,在纽约市周边50英里内售出;其次,价格低于15000美元。

在收集到全部url后,我使用scrapy来进一步收集了每个车的具体信息。收集到的价格指的是经销商的售价,不是现在的市场价格。由于时间维度的限制,我一共爬取了6747辆二手车的数据。

我对数据进行了一些分析。首先,我做了一个价格和年代的散点图。

我的二手车究竟值多少钱?

然后是一个价格和年代的箱线图。

我的二手车究竟值多少钱?

以及一个价格和年代的柱状图。

我的二手车究竟值多少钱?

我好奇2015年时,为何价格随年代上升而下降的趋势没有延续。在研究每年的汽车清单数时我发现了有趣的事情。

我的二手车究竟值多少钱?

因为许多车是出租3年再交回的,所以车龄在3年的被出售的车的数量高出很多。这可能是2015年价格高出其他年份的一个原因。转卖二手车另一个重要的影响因素是里程数。下面是一个出售汽车按里程数分类的直方图。

我的二手车究竟值多少钱?

价格与里程数关系的色码图(hex chart):

我的二手车究竟值多少钱?

当比较生产商时,由于此前的过滤条件设定在低于15000美元,所以呈现出朝奢侈品牌的偏斜。下面的图显示了各个生产商的转卖价格的分布。

我的二手车究竟值多少钱?

下面是不同车型的价格分布。

我的二手车究竟值多少钱?

对于那些在乎环保的用户,这是一个不同动力类型的车的价格分布。

我的二手车究竟值多少钱?

不同动力传送系统的分布:

我的二手车究竟值多少钱?

我使用双样本t检测比较了自动挡和手动挡的购买价格,看一看两者的平均值是否在统计学上意义上有不同。它们在统计学上确实不同。自动挡的比手动挡平均贵了1300美元。

我的二手车究竟值多少钱?

许多人关心购买的车的文件(title)上记录的状况。一个有趣的比较是那些没有事故记录的车和有过事故的车:

我的二手车究竟值多少钱?

很明显,没有事故记录会给价格带来很大影响。双样本t检测显示,平均值上的差距在1150美元。

最终,基于所有数据,下面是各款车型的二手转卖价格数据分布:

我的二手车究竟值多少钱?

一些简单的结论包括:自动挡比手动挡贵出1300美元;没有事故历史的二手车比有事故历史的贵1150美元;箱式轿车比其他车型的二手车卖的好等。

这些结果不仅对于那些想要购买二手车的人有参考价值,而且也对想要买新车的,纠结于买车还是租车的,以及考虑是否要卖掉现在有的车的人有价值。

注:本文编译自数据博客《How much is my used car worth?》。内容仅为作者观点,不代表DT财经立场。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

计算机程序设计艺术(第1卷)

计算机程序设计艺术(第1卷)

[美] 唐纳德·E. 克努特 / 苏运霖 / 国防工业出版社 / 2002-9 / 98.00元

7卷本《计算机程序设计艺术》的第1卷以基本的程序设计概念和技术开始,然后专注于信息结构——计算机内部信息的表示、数据元素之间的结构关系以及如何有效地处理它们,给出了对于模拟、数值方法、符号计算、软件和系统设计的初等应用。书中附有大量习题和答案,标明了难易程序及数学概念的使用。 此新版本增加了几十项简单且重要的算法和技术,并对有关数学预备知识作了大量修改以适应现时研究的趋势。一起来看看 《计算机程序设计艺术(第1卷)》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

XML 在线格式化
XML 在线格式化

在线 XML 格式化压缩工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换