推荐一些做Python数据分析的数据集

栏目: Python · 发布时间: 5年前

内容简介:这是涛哥给你推荐的第36篇好文来源:Python与算法社区 | 作者:榛果我们平时经常遇到去哪里下载数据的问题,想必你也为找到想要的数据而颇费周折,我也经常花费不少精力在寻找数据。这几天,特意检索了下,以下所列都可正常打开。

这是涛哥给你推荐的第36篇好文

来源:Python与算法社区 | 作者:榛果

我们平时经常遇到去哪里下载数据的问题,想必你也为找到想要的数据而颇费周折,我也经常花费不少精力在寻找数据。这几天,特意检索了下,以下所列都可正常打开。

1、农业相关

https://www.plants.usda.gov/dl_all.html

推荐一些做 <a href='https://www.codercto.com/topics/20097.html'>Python</a> 数据分析的数据集

2、生物学相关

1000 Genomes :http://www.internationalgenome.org/data

推荐一些做Python数据分析的数据集

细胞实验室,1万个数据集,2T 数据: http://www.cellimagelibrary.org/home

推荐一些做Python数据分析的数据集

癌细胞百科全书(CCLE) :https://portals.broadinstitute.org/ccle

推荐一些做Python数据分析的数据集

3、天气

世界气候 :http://www.worldclim.org/

推荐一些做Python数据分析的数据集

1929后世界各地天气 :https://en.tutiempo.net/climate

推荐一些做Python数据分析的数据集

4、地理

地球相关 :http://www.earthmodels.org/

推荐一些做Python数据分析的数据集

世界各国 :https://github.com/mledoze/countries

推荐一些做Python数据分析的数据集

世界开源地图OSM : https://www.openstreetmap.org/

推荐一些做Python数据分析的数据集

地图数据 :http://www.naturalearthdata.com/

推荐一些做Python数据分析的数据集

5、健康

健康大数据 :https://www.ehdp.com/vitalnet/datasets.htm

世界健康组织 :https://www.who.int/gho/en/

推荐一些做Python数据分析的数据集

6、网络数据

论文引用关系数据集 :https://www.aminer.cn/citation

推荐一些做Python数据分析的数据集

穷举之密码字典 :https://github.com/duyetdev/bruteforce-database

7、经济学

数据世界 :https://ourworldindata.org/

推荐一些做Python数据分析的数据集

数据中心 :https://cid.econ.ucdavis.edu/

推荐一些做Python数据分析的数据集

世界公司大全 :https://opencorporates.com/

推荐一些做Python数据分析的数据集

8、图像处理

imageNet : http://www.image-net.org/

动物情感 :http://www.imageemotion.org/

推荐一些做Python数据分析的数据集

YouTube 面部识别 :http://www.cs.tau.ac.il/~wolf/ytfaces/

推荐一些做Python数据分析的数据集

室内场景识别 :http://web.mit.edu/torralba/www/indoor.html

推荐一些做Python数据分析的数据集

狗数据集 :http://vision.stanford.edu/aditya86/ImageNetDogs/

人脸 :https://talhassner.github.io/home/projects/Adience/Adience-data.html

推荐一些做Python数据分析的数据集

人脸 :http://vis-www.cs.umass.edu/lfw/

推荐一些做Python数据分析的数据集

9、机器学习

ebay在线交易数据 :http://www.modelingonlineauctions.com/datasets

互联网电影资料库(IMDB) :https://www.imdb.com/interfaces/

keel 数据集 :https://sci2s.ugr.es/keel/datasets.php

机器学习的数据库 :http://mldata.org/

音乐数据集 :http://millionsongdataset.com/

UCI数据集市(473个数据集) :http://archive.ics.uci.edu/ml/index.php

推荐一些做Python数据分析的数据集

10、自然语言处理

博客语料库 :http://u.cs.biu.ac.il/~koppel/BlogCorpus.htm

CLiPS Stylometry Investigation 语料

https://www.clips.uantwerpen.be/datasets/csi-corpus

Google Books Ngrams :https://aws.amazon.com/datasets/google-books-ngrams/

机器翻译: http://statmt.org/wmt11/translation-task.html#download

11、社区网络

github 记录大全 :https://www.gharchive.org/

google scholar 引用关系 :http://www3.cs.stonybrook.edu/~leman/data/gscholar.db

以上数据集我们都可在内网打开,不需要科学上网,希望能帮助到你. 如果你还知道更多数据集,欢迎留言区中列一下,共享给大家。

关于更多开源数据集,欢迎点击「 阅读原文 」,查看收藏。

更多阅读

推荐几个BAT大神的公众号

自学编程的朋友,我想给你们这 5 个建议

[深度] 为什么我愿意花1000元加个社群?

推荐一些做Python数据分析的数据集 给个好看


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

突破之道

突破之道

(美)基思 R. 麦克法兰(Keith R. McFarland) / 江南、江维 / 机械工业出版社 / 2017-4 / 49.00

《从优秀到卓越》前传。 深入调查7000多家公司、1500多名关键管理人员,总结提炼出6大突破式发展策略。 解析创业成功后的公司如何腾飞,以几何速度增长,突破10亿关口。 阐述为什么创始人自己才是企业实现突破的最大障碍。一起来看看 《突破之道》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试