更新时间:2025-01-16 17:44:31
封面
版权信息
内容提要
推荐序
前言
第1章 机器学习基础
1.1 机器学习概述
1.1.1 机器学习简史
1.1.2 机器学习主要流派
1.2 机器学习、人工智能和数据挖掘
1.2.1 什么是人工智能
1.2.2 什么是数据挖掘
1.2.3 机器学习、人工智能和数据挖掘的关系
1.3 机器学习应用的典型领域
1.4 机器学习算法
1.5 机器学习的流程
习题
第2章 机器学习基本方法
2.1 统计分析
2.1.1 统计基础
2.1.2 常见概率分布
2.1.3 参数估计
2.1.4 假设检验
2.1.5 线性回归
2.1.6 逻辑回归
2.1.7 判别分析
2.1.8 非线性模型
2.2 高维数据降维
2.2.1 主成分分析
2.2.2 奇异值分解
2.2.3 线性判别分析
2.2.4 局部线性嵌入
2.2.5 拉普拉斯特征映射
2.3 特征工程
2.3.1 特征构造
2.3.2 特征选择
2.3.3 特征提取
2.4 模型训练
2.4.1 模型训练常见术语
2.4.2 训练数据收集
2.5 可视化分析
2.5.1 可视化分析的作用
2.5.2 可视化分析的基本流程
2.5.3 可视化分析方法
2.5.4 可视化分析常用工具
2.5.5 常见的可视化图表
2.5.6 可视化分析面临的挑战
第3章 决策树与分类算法
3.1 决策树
3.1.1 分支处理
3.1.2 连续属性离散化
3.1.3 过拟合问题
3.1.4 分类性能评价
3.2 集成学习
3.2.1 装袋法
3.2.2 提升法
3.2.3 GBDT算法
3.2.4 XGBoost算法
3.2.5 随机森林算法
第4章 聚类分析
4.1 聚类分析概述
4.1.1 聚类算法分类
4.1.2 良好聚类算法的特征
4.2 聚类分析的度量
4.2.1 外部指标
4.2.2 内部指标
4.3 基于划分的聚类
4.3.1 k-均值算法
4.3.2 k-medoids算法
4.3.3 k-prototype算法
4.4 基于密度的聚类
4.4.1 DBSCAN算法
4.4.2 OPTICS算法
4.5 基于层次的聚类
4.5.1 BIRCH聚类
4.5.2 CURE算法
4.6 基于网格的聚类
4.7 基于模型的聚类
4.7.1 基于概率模型的聚类
4.7.2 模糊聚类
4.7.3 基于Kohonen神经网络模型的聚类
第5章 文本分析
5.1 文本分析概述
5.2 文本特征提取及表示
5.2.1 TF-IDF算法
5.2.3 互信息
5.2.4 卡方统计量
5.2.5 词嵌入
5.2.6 语言模型
5.2.7 向量空间模型
5.3 知识图谱
5.3.1 知识图谱相关概念
5.3.2 知识图谱的存储
5.3.3 知识图谱的挖掘与计算
5.3.4 知识图谱的构建过程
5.4 词法分析
5.4.1 文本分词