内容简介:Chp1
Chp1
DM, Data Mining
- 为什么需要
Data Mining
信息技术的发展,计算机---存储和处理信息,网络---传播信息,物联网---收集信息,移动互联网---更加便捷地收集和传播信息
问题:数据总量爆炸式增加,如何从中提取真正有价值的信息
产生了新的领域(DM)
-
什么是 DM
Data Mining, 数据挖掘
Knowledge Discovery, 知识发现
Machine Learning, 机器学习
Knowledge Discovery in Database, KDD
-
理解 DM
KDD, 从数据库获取数据---数据清洗---放入数据仓库(warehouse)---选出可能相关的感兴趣的信息---数据挖掘---评估---知识
BI, Business Intelligence, 商业智能
ML, 机器学习
-
从 4 个不同的角度理解 DM
- 待挖掘数据的种类: 文本,图像,视频,音频,...
- 挖掘方法: 统计学,机器学习,可视化,...
- 挖掘出的知识: 特征,类别,趋势,区别,关联,...
- 应用领域: 互联网,销售,银行,股票,生物,...
-
DM 和 ML 的区别
DM: 发现规律,填补单个空缺
ML: 预测一整行
-
DM 的历史
略
-
DM 面临的主要挑战
用户交互
效率和可扩展性
数据类型的多样性
挖掘方法和技术
社会问题
Big Data, 大数据
-
定义: 4V
Volume, 数据体量巨大,PB 级别
Velocity, 要求处理速度快,1 秒定律,可从各种类型的数据中快速获得高价值的信息
Variety, 数据类型繁多
Value, 只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报
-
应用
Google Flu Trends Prediction
Promotion of pregnant women products in Target supermarket
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 大数据产品经理必备的数据挖掘知识概述(一)认识数据
- 大数据产品经理必备的数据挖掘知识概述(一)认识数据之数据可视化
- 数据挖掘竞赛指南:曾经的数据挖掘少年,如今的阿里算法大佬
- 数据挖掘复习笔记---02.数据
- 数据挖掘建模:如何从数据中“淘金”?
- 数据挖掘复习笔记---03.数据预处理
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Netty实战
诺曼·毛瑞尔(Norman Maurer)、马文·艾伦·沃尔夫泰尔(Marvin Allen Wolfthal) / 何品 / 人民邮电出版社 / 2017-5-1 / 69.00
编辑推荐 - Netty之父”Trustin Lee作序推荐 - 阿里巴巴中间件高级技术专家为本书中文版作序推荐 - 系统而详细地介绍了Netty的各个方面并附带了即用型的优质示例 - 附带行业一线公司的案例研究 - 极实用的Netty技术书 无论是构建高性能的Web、游戏服务器、推送系统、RPC框架、消息中间件还是分布式大数据处理引擎,都离不开Nett......一起来看看 《Netty实战》 这本书的介绍吧!