初学者机器学习教程

栏目: 数据库 · 发布时间: 6年前

内容简介:数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。数据科学家需要具备以下技能:作为总结,我们将学习python成为数据科学家! 对于第1,2,3,4,5和6部分,请查看“初学者”的“数据科学教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/

数据科学家 在本教程中,我只向您解释您需要成为一名数据科学家,而不是更多或更少。

数据科学家需要具备以下技能:

  • 基本工具:像python,R或SQL。 你不需要知道一切。 你只需要学习如何使用python
  • 基本统计:像平均值,中位数或标准差。 如果您了解基本统计信息,则可以轻松使用python。
  • 数据处理:处理混乱和困难的数据。 就像一个不一致的日期和字符串格式。 正如你猜的那样,python帮助了我们。
  • 数据可视化:标题实际上是解释性的。 我们将使用像matplot和seaborn库这样的 python 来可视化数据。
  • 机器学习:你不需要理解机器学习技术背后的数学。 您只需要了解机器学习的基础知识,并学习如何使用python时实现它。

作为总结,我们将学习python成为数据科学家! 对于第1,2,3,4,5和6部分,请查看“初学者”的“数据科学教程”。 https://www.kaggle.com/kanncaa1/data-sciencetutorial-for-beginners/

在本教程中,我不打算对您您学习机器学习,我将解释如何自己学习一些东西。 孔子:授人以鱼不如授人以渔。

目录

  • Python简介:
    • Matplotlib
    • 字典
    • Pandas
    • 逻辑,控制流和过滤
    • 循环数据结构
  • Python 数据科学 工具
    • 用户定义的函数
    • 范围
    • 嵌套函数
    • 默认和灵活的参数
    • Lambda函数
    • 匿名函数
    • 迭代器
    • 列表组合
  • 清洗数据
    • 诊断数据已进行清洗
    • 探索性数据分析EDA
    • 可视化探索性数据分析
    • 整洁的数据
    • 数据透视
    • 数据合并
    • 数据类型
    • 缺失数据和使用assert进行测试
  • Pandas基础
    • Pandas回顾
    • 从零开始构建数据框
    • 可视化探索性数据分析
    • 统计化探索性数据分析
    • 索引化Pandas时间序列
    • 重采样Pandas时间序列
  • 使用Pandas操作数据
    • 索引数据框
    • 切片数据框
    • 过滤数据框
    • 转换数据框
    • 索引对象和标签数据
    • 分层索引
    • 透视数据框
    • 堆叠和不堆叠数据框
    • 融化数据框
    • 类别和分组
  • 数据可视化
    • Seaborn:https://www.kaggle.com/kanncaa1/seaborn-for-beginners
    • Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-1
    • Bokeh: https://www.kaggle.com/kanncaa1/interactive-bokeh-tutorial-part-2
  • 统计思维
    • https://www.kaggle.com/kanncaa1/basic-statistic-tutorial-for-beginners
  • 机器学习
    • 有监督学习
      • EDA(探索性数据分析)
      • K-Nearest Neighbors(KNN)
      • 回归
      • 交叉验证(CV)
      • 超参数调整
      • 数据预处理
    • 无监督学习
      • K均值聚类
      • 聚类评价
      • 标准化
      • 层次结构
      • T - 分布式随机邻域嵌入(T - SNE)
      • 主成分分析PCA
  • 深度学习
  • https://www.kaggle.com/kanncaa1/deep-learning-tutorial-for-beginners
  • 时间序列预测
  • https://www.kaggle.com/kanncaa1/time-series-prediction-tutorial-with-eda
  • 用Pytorch做深度学习
  • 人工神经网络:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
  • 卷积神经网络:https://www.kaggle.com/kanncaa1/pytorch-tutorial-for-deep-learning-lovers
  • 循环神经网络:https://www.kaggle.com/kanncaa1/recurrent-neural-network-with-pytorch

原文链接: https://www.kaggle.com/kanncaa1/machine-learning-tutorial-for-beginners

版权声明:作者保留权利,严禁修改,转载请注明原文链接。

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。 平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。 您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。 我们努力坚持做原创,聚合和分享优质的省时的数据知识! 我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

疯长

疯长

[美]肖恩· 阿美拉蒂 / 中信出版集团 / 2018-10 / 45

实现财务回报以及扩大影响力是企业家长期关注和讨论的问题。 为什么有些公司实现了10倍的投资回报,而其他的则勉力支撑?产品类似的公司,为什么有的家喻户晓,有的默默无闻直至退出市场…… 为了了解真相,作者阿美拉蒂在这本书中精选10组对照公司,比如,同为社交平通的Facebook(脸谱网)和Friendster(交友网),同为快餐领域先驱的麦当劳和白色城堡,再比如都在开发电动汽车市场的特斯拉......一起来看看 《疯长》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器