数据挖掘复习笔记---01.概述

栏目: 数据库 · 发布时间: 7年前

内容简介:Chp1

Chp1

DM, Data Mining

  • 为什么需要 Data Mining

    信息技术的发展,计算机---存储和处理信息,网络---传播信息,物联网---收集信息,移动互联网---更加便捷地收集和传播信息

    问题:数据总量爆炸式增加,如何从中提取真正有价值的信息

    产生了新的领域(DM)

  • 什么是 DM

    Data Mining, 数据挖掘

    Knowledge Discovery, 知识发现

    Machine Learning, 机器学习

    Knowledge Discovery in Database, KDD

  • 理解 DM

    KDD, 从数据库获取数据---数据清洗---放入数据仓库(warehouse)---选出可能相关的感兴趣的信息---数据挖掘---评估---知识

    数据挖掘复习笔记---01.概述

    BI, Business Intelligence, 商业智能

    数据挖掘复习笔记---01.概述

    ML, 机器学习

    数据挖掘复习笔记---01.概述

  • 从 4 个不同的角度理解 DM

    • 待挖掘数据的种类: 文本,图像,视频,音频,...
    • 挖掘方法: 统计学,机器学习,可视化,...
    • 挖掘出的知识: 特征,类别,趋势,区别,关联,...
    • 应用领域: 互联网,销售,银行,股票,生物,...
  • DM 和 ML 的区别

    数据挖掘复习笔记---01.概述

    DM: 发现规律,填补单个空缺

    ML: 预测一整行

  • DM 的历史

  • DM 面临的主要挑战

    用户交互

    效率和可扩展性

    数据类型的多样性

    挖掘方法和技术

    社会问题

Big Data, 大数据

  • 定义: 4V

    Volume, 数据体量巨大,PB 级别

    Velocity, 要求处理速度快,1 秒定律,可从各种类型的数据中快速获得高价值的信息

    Variety, 数据类型繁多

    Value, 只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报

  • 应用

    Google Flu Trends Prediction

    Promotion of pregnant women products in Target supermarket


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

深度学习

深度学习

[美]特伦斯·谢诺夫斯基(Terrence Sejnowski) / 姜悦兵 / 中信出版集团 / 2019-2 / 88

全球科技巨头纷纷拥抱深度学习,自动驾驶、AI医疗、语音识别、图像识别、智能翻译以及震惊世界的AlphaGo,背后都是深度学习在发挥神奇的作用。深度学习是人工智能从概念到繁荣得以实现的主流技术。经过深度学习训练的计算机,不再被动按照指令运转,而是像自然进化的生命那样,开始自主地从经验中学习。 本书作者特伦斯·谢诺夫斯基是全球人工智能十大科学家之一、深度学习先驱及奠基者,亲历了深度学习在20世纪......一起来看看 《深度学习》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

URL 编码/解码
URL 编码/解码

URL 编码/解码