目录
第一部分 基础知识
第1章 机器学习的发展和应用 2
1.1 什么是机器学习 2
1.2 机器学习的发展 3
1.3 机器学习的应用 5
1.3.1 数据挖掘 5
1.3.2 人脸检测 6
1.3.3 人机对弈 7
1.3.4 机器翻译 7
1.3.5 自动驾驶 7
1.3.6 其他应用 8
1.4 本章小结 8
第2章 Python编程基础 9
2.1 Python概述 9
2.2 Python平台搭建 9
2.2.1 Python环境部署 9
2.2.2 Python运行方式 12
2.3 Python语法基础 14
2.3.1 Python编程规范 14
2.3.2 基本数据类型 15
2.3.3 Python编程基础 18
2.3.4 模块和包 21
2.3.5 文件操作 22
2.4 本章小结 23
第3章 数据分析基础 24
3.1 数据分析概述 24
3.1.1 什么是数据分析 24
3.1.2 数据分析的步骤 24
3.1.3 常用的数据分析策略 26
3.1.4 数据分析方法 27
3.1.5 数据分析工具 28
3.2 Python中常用的数据分析库 29
3.2.1 Numpy 29
3.2.2 Pandas 33
3.2.3 Matplotlib 37
3.2.4 SciPy 39
3.3 利用Python进行数据分析 42
3.3.1 数据加载、存储 42
3.3.2 数据清洗和准备 46
3.3.3 数据规整 54
3.3.4 数据可视化 61
3.3.5 数据分组和聚合 64
3.3.6 数据分析案例 70
3.4 本章小结 77
第4章 机器学习基础 78
4.1 机器学习简介 78
4.1.1 机器学习中的基本概念 78
4.1.2 机器学习分类及训练方式 79
4.1.3 机器学习三要素 81
4.2 机器学习库 83
4.2.1 Scikit-learn 83
4.2.2 StatsModels 87
4.3 机器学习算法 89
4.3.1 回归算法 89
4.3.2 支持向量机 91
4.3.3 决策树 92
4.3.4 聚类 94
4.3.5 降维 100
4.3.6 集成学习 102
4.3.7 神经网络 106
4.3.8 常用模型的特点和应用场景 109
4.4本章小结 111
第二部分 大数据测试
第5章 大数据基础 114
5.1 什么是大数据 114
5.2 Hadoop生态系统 115
5.2.1 HDFS 116
5.2.2 MapReduce 118
5.2.3 Hive 121
5.2.4 HBase 124
5.2.5 Storm、Spark和Flink 131
5.3 数据仓库与ETL流程 133
5.3.1 什么是ETL 133
5.3.2 什么是数据仓库 134
5.3.3 数据仓库的架构 135
5.4 本章小结 136
第6章 大数据测试指南 137
6.1 大数据测试概述 137
6.1.1 什么是大数据测试 137
6.1.2 大数据测试与传统数据测试差异 138
6.2 大数据ETL测试 139
6.2.1 ETL测试流程 139
6.2.2 ETL测试方法 140
6.2.3 ETL测试场景 143
6.3 本章小结 147
第7章 大数据工具实践 148
7.1 大数据测试工具 148
7.1.1 大数据测试的痛点 148
7.1.2 大数据测试工具easy_data_test的设计 149
7.1.3 大数据测试工具easy_data_test的使用 152
7.1.4 大数据测试工具展望 157
7.2 数据质量监控平台 157
7.2.1 数据质量把控环节 158
7.2.2 数据质量评估要点 158
7.2.3 数据质量监控平台设计 159
7.3 数据调度平台 163
7.3.1 调度系统概述 163
7.3.2 Azkaban概述 163
7.3.3 Azkaban实践 164
7.4 本章小结 168
第三部分 模型测试
第8章 机器学习测试基础 170
8.1 机器学习生命周期 170
8.2 机器学习测试难点 173
8.3 机器学习测试重点 174
8.4 模型工程服务测试 176
8.4.1 单元测试 177
8.4.2 集成测试 178
8.4.3 系统测试 179
8.5 A B测试 180
8.5.1 A B测试 180
8.5.2 做A B测试的原因 181
8.5.3 A B测试在机器学习模型中的应用 181
8.6 本章小结 182
第9章 特征专项测试 184
9.1 特征工程简介 184
9.1.1 数据探索 184
9.1.2 数据预处理 185
9.1.3 特征构建 190
9.1.4 特征选择 190
9.2 特征测试方法 191
9.2.1 特征指标分析 191
9.2.2 特征稳定性测试 198
9.3 特征测试实践 199
9.3.1 特征指标分析实践 199
9.3.2 特征可视化实践 203
9.3.3 特征稳定性测试实践 207
9.3.4 特征监控实践 211
9.4 本章小结 212
第10章 模型算法评估测试 213
10.1 模型算法评估基础 213
10.1.1 模型算法评估概述 213
10.1.2 样本数据划分策略 214
10.1.3 统计学指标与统计图 216
10.1.4 模型算法评估指标 217
10.2 模型算法的测试方法 223
10.2.1 模型蜕变测试 223
10.2.2 模型模糊测试 226
10.2.3 模型鲁棒性测试 227
10.2.4 模型安全测试 229
10.2.5 模型可解释性测试 230
10.2.6 模型在线测试 233
10.2.7 模型监控与迭代 234
10.3 不同应用场景下模型算法的评测 235
10.3.1 图像分类应用场景下的模型算法评测 235
10.3.2 推荐应用场景下的模型算法评测 236
10.3.3 金融风控应用场景下的模型算法评测 239
10.4 本章小结 241
第四部分 模型工程
第11章 模型评估平台实践 244
11.1 模型评估平台背景 244
11.2 模型评估平台的设计 245
11.2.1 平台需求分析 245
11.2.2 平台架构设计 246
11.3 模型评估平台展示 253
11.3.1 模型配置规则 253
11.3.2 模型评估指标 255
11.3.3 模型评估报告 261
11.4 模型评估平台总结 263
11.4.1 回顾 264
11.4.2 展望 265
11.5 本章小结 266
第12章 机器学习工程技术 267
12.1 机器学习平台概述 267
12.1.1 机器学习平台发展历程 267
12.1.2 主流的机器学习平台 269
12.1.3 机器学习平台的建设 270
12.2 数据与建模工程技术 272
12.2.1 数据采集 272
12.2.2 数据存储 272
12.2.3 数据加工 273
12.2.4 样本数据 274
12.2.5 特征工程 275
12.2.6 模型构建 275
12.3 模型部署工程技术 279
12.3.1 模型部署概述 279
12.3.2 模型发布方式 279
12.3.3 模型线上监控 284
12.4 本章小结 286
第13章 机器学习的持续交付 287
13.1 机器学习持续交付的介绍与定义 287
13.1.1 持续交付 287
13.1.2 机器学习持续交付的定义 289
13.2 机器学习持续交付的主要挑战 290
13.2.1 组织流程的挑战 290
13.2.2 复杂技术的挑战 292
13.3 如何构建机器学习管道 292
13.3.1 机器学习管道概述 293
13.3.2 构建机器学习管道 293
13.3.3 Pipeline(管道)设计的关注点 307
13.3.4 Pipeline的技术组件 307
13.4 本章小结 309
第五部分 AIInTest
第14章 AI在测试领域的探索与实践 312
14.1 测试发展面临的挑战 312
14.2 AI在测试领域的应用及优势 313
14.3 业界智能化测试案例介绍 314
14.3.1 AI在测试效能方面的探索 315
14.3.2 AI在自动化测试方面的实践 317
14.4 主流AI测试工具简介 320
14.5 本章小结 322
第15章 AI时代测试工程师的未来 324
15.1 AI对测试未来发展的影响 324
15.2 AI时代测试工程师的定位 325
15.3 测试工程师的AI学习路线 326
15.4 本章小结 328
参考文献 329
51Testing软件测试网将在近期对本书部分章节进行独家连载,敬请关注
查看更多《51Testing软件测试网作品系列》:http://www.51testing.com/html/36/category-catid-136.html
查看更多《51Testing软件测试网作品系列》:http://www.51testing.com/html/36/category-catid-136.html