内容简介:数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。数据科学家需要具备以下技能:作为总结,我们将学习python成为数据科学家! 对于第1,2,3,4,5和6部分,请查看“初学者”的“数据科学教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/
数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。
数据科学家需要具备以下技能:
- 基本工具:像python,R或SQL。 你不需要知道一切。 你只需要学习如何使用python
- 基本统计:像平均值,中位数或标准差。 如果您了解基本统计信息,则可以轻松使用python。
- 数据处理:处理混乱和困难的数据。 就像一个不一致的日期和字符串格式。 正如你猜的那样,python帮助了我们。
- 数据可视化:标题实际上是解释性的。 我们将使用像matplot和seaborn库这样的 python 来可视化数据。
- 机器学习:你不需要理解机器学习技术背后的数学。 您只需要了解机器学习的基础知识,并学习如何使用python时实现它。
作为总结,我们将学习python成为数据科学家! 对于第1,2,3,4,5和6部分,请查看“初学者”的“数据科学教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/
在本教程中,我不打算对您您学习机器学习,我将解释如何自己学习一些东西。 孔子:授人以鱼不如授人以渔。
目录
-
Python简介:
- Matplotlib
- 字典
- Pandas
- 逻辑,控制流和过滤
- 循环数据结构
-
Python 数据科学 工具 箱
- 用户定义的函数
- 范围
- 嵌套函数
- 默认和灵活的参数
- Lambda函数
- 匿名函数
- 迭代器
- 列表组合
-
清洗数据
- 诊断数据已进行清洗
- 探索性数据分析EDA
- 可视化探索性数据分析
- 整洁的数据
- 数据透视
- 数据合并
- 数据类型
- 缺失数据和使用assert进行测试
-
Pandas基础
- Pandas回顾
- 从零开始构建数据框
- 可视化探索性数据分析
- 统计化探索性数据分析
- 索引化Pandas时间序列
- 重采样Pandas时间序列
-
使用Pandas操作数据
- 索引数据框
- 切片数据框
- 过滤数据框
- 转换数据框
- 索引对象和标签数据
- 分层索引
- 透视数据框
- 堆叠和不堆叠数据框
- 融化数据框
- 类别和分组
-
数据可视化
- Seaborn:https://www.kaggle.com/kanncaa1/seaborn-for-beginners
- Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-1
- Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-2
-
统计思维
- https://www.kaggle.com/kanncaa1/basic-statistic-tutorial-for-beginners
-
机器学习
-
有监督学习
- EDA(探索性数据分析)
- K-Nearest Neighbors(KNN)
- 回归
- 交叉验证(CV)
- 超参数调整
- 数据预处理
-
无监督学习
- K均值聚类
- 聚类评价
- 标准化
- 层次结构
- T - 分布式随机邻域嵌入(T - SNE)
- 主成分分析PCA
-
有监督学习
- 深度学习
- https://www.kaggle.com/kanncaa1/deep-learning-tutorial-for-beginners
- 时间序列预测
- https://www.kaggle.com/kanncaa1/time-series-prediction-tutorial-with-eda
- 用Pytorch做深度学习
- 人工神经网络:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
- 卷积神经网络:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
- 循环神经网络:https://www.kaggle.com/kanncaa1/recurrent-neural-network-with-pytorch
原文链接: https://www.kaggle.com/kanncaa1/machine-learning-tutorial-for-beginners
版权声明:作者保留权利,严禁修改,转载请注明原文链接。
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
测出转化率:营销优化的科学与艺术
【美】高尔德(Goward,C.) / 谭磊、唐捷译 / 电子工业出版社 / 2014-10-1 / 68.00元
本书作者通过已成功实现大幅提升转化率的案例,展示了大量以营销为核心的电子商务网站的测试设计方法及转化优化方案。书中作者强调了测试及优化思维的重要性,并就实现方法做了详细讲解。 通过本书,读者将学到如何能够在网站遇到发展和收入瓶颈时,测试出存在的问题并找到解决方案;如何可以深入地了解客户需求,并以此为基础优化网站,使其达到提升转化率的目的;如何提升网站的竞争优势,把在线营销渠道变成高效的转化通......一起来看看 《测出转化率:营销优化的科学与艺术》 这本书的介绍吧!