内容简介:编者按:本文来自微信公众号我们都知道,最近几年AI创业几乎呈指数级增长。那么AI领域的投资规模到底有多少大?这些AI创业公司的规模如何?对他们来说最有前途的市场是哪些?这些问题我们都可以从AngelList公开的数据中得到答案。
编者按:本文来自微信公众号 “大数据文摘” (ID:BigDataDigest), 作者Rodrigo NaderFollow、 编译群青 ;36氪经授权发布。
我们都知道,最近几年AI创业几乎呈指数级增长。那么AI领域的投资规模到底有多少大?这些AI创业公司的规模如何?对他们来说最有前途的市场是哪些?
这些问题我们都可以从AngelList公开的数据中得到答案。
数据分析
首先进行清洗和预处理,包括格式化日期、正规化文本,以及将金额相关的字符串转换为浮点数字。
然后就是对这个包含10139个公司的数据集进行各种操作。
1、统计这些创业公司使用的编程语言
上图显示,在机器学习方面,AngelList上的创业公司更偏爱使用python,python的使用率达到93.5%。其次是javascript,使用率为3.94%。但是,我们只统计了AngelList头部技术公司,因此这没有包含其他重要的编程语言。
如果按年份统计数据,得到2010年-2019年这些编程语言使用情况的变化:
编程语言使用情况变迁
上图显示,Python的使用率显著上升。这也印证了,作为一种惊人的、高水准的通用语言,python拥有范围广泛的强大的库,并在数据科学和机器学习领域最为著名。
2、查看这些创业公司分布在哪些市场领域
10139个创业公司所在的市场分布
有一些比较常见的行业(比如b2b和saas)在其他市场大类别中也经常出现(如在大数据分析和大数据中),但还是可以在人工智能相关领域中做一些比较。
3、统计各个行业的投资额
根据市场来聚合数据并总结出融资,可以知道各个行业的投资额总共有多少:
各行业的总投资额
上图列出投资额最高的20个行业,其中酒店行业遥遥领先,达到100亿美元以上,排名第二的新闻行业达到40亿美元以上。但这不能说明这些行业获得投资的创业公司的数量最多。
比如,这其中投资规模最大的企业有(以十亿美元为单位):
-
Airbnb→10.3(酒店)
-
Netscape→4.2(新闻)
-
Nest→3.3(物联网)
-
Palantir→2.1(分析)
-
Grail→1.7(诊断)
这解释了为什么酒店行业的投资量巨大:一两个规模巨大的企业会对总投资量产生重大影响。
如果选取每个行业的平均投资额则可以获得不同的结果:
各行业的平均投资额
上图是平均投资额最多的10个行业,并不包含酒店行业。遥遥领先的是新闻行业,平均投资额达到20亿美元,其余的行业都在5亿美元以下。
4、分析不同投资额区间的企业分布数量
首先我们统计下每个行业的获投资企业的数量,然后对比投资额范围。例如,有多少移动广告公司获得了1到1000万美元的投资?
将投资范围分为5个区间,统计每个区间内,获得相应投资额的企业数量:
通过这个相对复杂的分析,投资者和创业者可以更深入了解与投资规模相关的市场行为。如果你的公司处在第一个阶段(种子轮),在哪个市场更容易获得融资?又哪些企业变成了融资数十亿美元的独角兽?
5、分析投资人对不同市场的兴趣变化
使用每个行业每年的投资额,可以看到2011年以来市场如何变化:
2011年以来的市场变化
6、分析不同阶段的创业企业的受欢迎程度
按创业公司所处的发展阶段来查看平均投资额:
上图显示,A轮阶段的平均投资低于种子轮公司。而企业发展越成熟,获得投资额约大。
7、2010年以来的的总投资(以百万美元为单位)以及创业公司数量
历年总投资额
可以看到,2012年开始,AngelList上的数据爆炸增长,风险投资显著增长。这也伴随着越来越多的创业公司在全球范围内出现。
下图显示了每年在AngelList上注册的创业公司数量。
历年创业公司数量
8、全球范围的创业公司分布情况
最后,我们使用Geopy定位提取坐标,建立一个分布在世界各地的创业公司集群地图。可以获得一个交互式的地图:
创业公司集群地图
这个定位地图包括了10000+个公司的位置。虽然样本较小,但仍然非常好的显示了不同国家的科技分布情况。
在这个交互式地图上,点击集群可以打开更小的集群,持续点击可以看到企业。点击单个企业可以获得他们的网站链接。(交互式地图获取方式见文末)
根据投资额进行加权,得到一个热力图。所以人工智能的钱都去哪里了呢?
热力图
9、这些创业公司的标语中最常出现的词语
根据创业公司标语得到的词云
以上对这个数据集的处理还不够全面。还可以从员工数量(反应企业规模)、企业年龄、标语(使用NLP进行分析)中获得更多信息。甚至还可以获得——创始人、联合创始人和投资者的联系信息。
PS:如果你想获得数据和notebook、地图,请前往作者的GitHub库:
https://github.com/rodrigosnader/angel-scraper
相关报道:
https://towardsdatascience.com/data-analysis-of-10-000-ai-startups-5ea7e957e90
以上所述就是小编给大家介绍的《最受投资人热捧的AI领域是哪些?10000+个AI创业公司的数据分析告诉你》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 数据分析是什么,如何完善数据分析知识体系
- 大数据分析工程师入门(二十):数据分析方法
- 蚂蚁数据分析平台的演进及数据分析方法的应用
- 数据分析的准备工作:从问题分析到数据清洗
- 数据分析:基于智能标签,精准管理数据
- [译] 每位数据分析师应该要知道的基本数据分析技术
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。