

预测分析 PYTHON语言实现PDF格式文档图书下载
- 购买点数:6 点
- 作 者:(美)约瑟夫·巴布科克著 余水清译
- 出 版 社:北京市:机械工业出版社
- 出版年份:2017
- ISBN:9787111573890 9787111573890
- 标注页数:200 页
- PDF页数:216 页
第1章 数据转换成决策——从分析应用着手 1
1.1 设计高级分析方案 3
1.1.1 数据层:数据仓库、数据湖和数据流 3
1.1.2 模型层 5
1.1.3 部署层 8
1.1.4 报告层 8
1.2 案例学习:社交媒体数据的情感分析 9
1.2.1 数据输入和转换 10
1.2.2 合理性检查 10
1.2.3 模型开发 10
1.2.4 评分 10
1.2.5 可视化和报告 10
1.3 案例学习:针对性电子邮件活动 11
1.3.1 数据输入和转换 11
1.3.2 合理性检查 11
1.3.3 模型开发 12
1.3.4 评分 12
1.3.5 可视化和报告 12
1.4 总结 13
第2章 Python数据分析和可视化初探 14
2.1 在IPython中探索分类和数值型数据 15
2.1.1 安装IPython notebook 15
2.1.2 notebook的界面 15
2.1.3 加载和检视数据 17
2.1.4 基本操作——分组、过滤、映射以及透视 19
2.1.5 用Matplotlib绘制图表 23
2.2 时间序列分析 28
2.2.1 清洗和转换 28
2.2.2 时间序列诊断 29
2.2.3 连接信号和相关性 31
2.3 操作地理数据 33
2.3.1 加载地理数据 33
2.3.2 工作在云上 34
2.4 PySpark简介 35
2.4.1 创建SparkContext 35
2.4.2 创建RDD 36
2.4.3 创建Spark DataFrame 37
2.4 总结 38
第3章 在噪声中探求模式——聚类和无监督学习 39
3.1 相似性和距离度量 39
3.1.1 数值距离度量 40
3.1.2 相关相似性度量和时间序列 43
3.1.3 分类数据的相似性度量 48
3.1.4 k-均值聚类 52
3.2 近邻传播算法——自动选择聚类数量 56
3.3 k-中心点算法 58
3.4 凝聚聚类算法 59
3.5 Spark中的数据流聚类 63
3.6 总结 66
第4章 从点到模型——回归方法 67
4.1 线性回归 67
4.1.1 数据准备 69
4.1.2 模型拟合和评价 72
4.1.3 回归输出的显著性差异 75
4.1.4 广义估计方程 79
4.1.5 混合效应模型 80
4.1.6 时间序列数据 80
4.1.7 广义线性模型 81
4.1.8 线性模型的正则化 82
4.2 树方法 84
4.2.1 决策树 84
4.2.2 随机森林 87
4.3 利用PySpark进一步扩展——预测歌曲的发行年份 90
4.4 总结 91
第5章 数据分类——分类方法和分析 92
5.1 逻辑回归 92
5.1.1 多分类逻辑分类器:多元回归 94
5.1.2 分类问题中的数据格式化 95
5.1.3 基于随机梯度下降法的学习逐点更新 98
5.1.4 使用二阶方法联合优化所有参数 99
5.2 拟合模型 102
5.3 评估分类模型 104
5.4 通过支持向量机分离非线性边界 108
5.4.1 人口普查数据的拟合和SVM 110
5.4.2 Boosting:组合小模型以改善准确度 111
5.4.3 梯度提升决策树 112
5.5 分类方法比较 114
5.6 案例学习:在PySpark中拟合分类器模型 115
5.7 总结 116
第6章 词语和像素——非结构化数据分析 117
6.1 文本数据分析 117
6.1.1 文本数据清洗 118
6.1.2 从文本数据中提取特征 120
6.1.3 利用降维来简化数据集 121
6.2 主分量分析 122
6.2.1 隐含狄利克雷分布 130
6.2.2 在预测模型中使用降维 132
6.3 图像 132
6.3.1 图像数据清洗 132
6.3.2 利用图像阈值来突出显示对象 135
6.3.3 图像分析中的降维 137
6.4 案例学习:在PySpark中训练一个推荐系统 139
6.5 总结 141
第7章 自底向上学习——深度网络和无监督特征 142
7.1 使用神经网络学习模式 142
7.1.1 单一感知器构成的网络 143
7.1.2 感知器组合——一个单层神经网络 143
7.1.3 反向传播的参数拟合 145
7.1.4 判别式模型与生成式模型 148
7.1.5 梯度消失及“解去” 149
7.1.6 预训练信念网络(贝叶斯网络) 151
7.1.7 使用dropout来正则化网络 152
7.1.8 卷积网络和纠正单元 153
7.1.9 利用自编码网络压缩数据 155
7.1.10 优化学习速率 156
7.2 TensorFlow库与数字识别 157
7.2.1 MNIST数据 157
7.2.2 构建网络 159
7.3 总结 162
第8章 利用预测服务共享模型 163
8.1 预测服务的架构 163
8.2 客户端和发出请求 165
8.2.1 GET请求 165
8.2.2 POST请求 166
8.2.3 HEAD请求 166
8.2.4 PUT请求 166
8.2.5 DELETE请求 167
8.3 服务器——Web流量控制器 167
8.4 利用数据库系统持久化存储信息 169
8.5 案例学习——逻辑回归服务 170
8.5.1 建立数据库 170
8.5.2 Web服务器 172
8.5.3 Web应用 173
8.6 总结 184
第9章 报告和测试——分析型系统迭代 185
9.1 利用诊断检查模型的健康度 185
9.1.1 评估模型性能的变化 185
9.1.2 特征重要性的变化 188
9.1.3 无监督模型性能的变化 189
9.2 通过AB测试对模型进行迭代 190
9.2.1 实验分配——将客户分配给实验 190
9.2.2 决定样本大小 191
9.2.3 多重假设检验 193
9.3 沟通指南 194
9.3.1 将术语转换为业务价值 194
9.3.2 可视化结果 194
9.3.3 报告服务器 195
9.3.4 报告应用 195
9.3.5 可视化层 197
9.4 总结 199
- 《预测分析 PYTHON语言实现》(美)约瑟夫·巴布科克著;余水清译 2017
- 《预测分析建模 Python与R语言实现》(美)托马斯 W.米勒(Thomas W.Miller)著 2016
- 《预测分析 R语言实现》(希)鲁伊·米格尔·福特(Rui Miguel Forte)著 2017
- 《R语言预测实战》游皓麟著 2016
- 《预测分析与数据挖掘 RapidMiner实现》Vijay Kotu 2018
- 《考研英语作文预测30篇》考研英语命题研究组编著 2014
- 《实用预测分析》(美)拉尔夫·温特斯著;刘江一,陈瑶,刘旭斌译 2018
- 《图灵程序设计丛书 预测分析与数据挖掘 RapidMiner实现》(美)瓦杰·考图(Vijay Kotu)著;严云译 2018
- 《智能预测控制及其MATLAB实现》李国勇编著 2010
- 《实用灰色预测建模方法及其MATLAB程序实现》曾波,尹小勇,孟伟著 2018
- 《预测分析 PYTHON语言实现》(美)约瑟夫·巴布科克著;余水清译 2017
- 《管理工程与技术 英文》(美)莫尔斯,(美)巴布科克著 2011
- 《高级技术分析》(美)巴布科克著;黄凯译 2007
- 《攻守四大战技》(美)巴布科克著;文奕译 2014
- 《农业化学化的效果 节译本》(苏联)п.A.巴布罗夫斯基著;余志远译 1965
- 《蒸汽的发生与应用》(加拿大)巴布科克·威尔科克斯公司编著;恽肇强等译 1990
- 《拳击集萃》(美)科克斯,(美)凯瑟著;恽小明译 1985
- 《机械式交易系统 原理、构建与实战》(美)小布鲁斯·巴布科克著;李汉军,任帅波,陈旭译 2017
- 《工程技术管理学 第3版》丹尼尔·L. 巴布科克(Daniel L. Babcock),露西·C. 莫尔斯(Lucy C. Morse)著;金永红,奚玉芹译(密苏里大学教授) 2005
- 《云革命》(美)巴布科克著 2011
- 《北京志 工业卷 机械工业志 农机工业志》北京市地方志编纂委员会编 2001
- 《机械工业和机械图书的出版发行 机械工业出版社发行培训教材》陈慧毅,杨少晨编 1988
- 《冷冲模设计》赵孟栋主编 2006
- 《机械工业出版社》慕拉维叶夫著;孔庆复译 1959
- 《中等职业教育机电类规划教材 机械工业出版社精品教材 机械设计基础 第2版》机械职业教育基础课教学指导委员会机械设计学科组组编;柴鹏飞主编 2006
- 《集知播识春秋录 机械工业出版社 1952-1988.机械科学技术情报研究所 1958-1988》机械科技情报研究所,机械工业出版社编 1988
- 《北京市立高级工业职业学校机械科毕业学生韩丕纯分数表/韩丕纯毕业证书》 1949
- 《电线电缆》上海市电缆研究所编 1975
- 《FoxBASE+ 三周通》文忠等编著 1995
- 《普通高等教育机电类专业规划教材 机械工业出版社精品教材 机械加工技术 第2版》孙学强主编 2016