章节目录
第一篇 监督学习
第二篇 无监督学习
第13章 无监督学习概论
13.1.1 无监督学习基本原理
13.1.2 基本问题
13.1.3 机器学习三要素
13.1.4 无监督学习方法
第14章 聚类方法
14.1 聚类的基本概念
14.1.1 相似度或距离
14.1.2 类或簇
14.1.3 类与类之间的距离
14.2 层次聚类
14.3 k均值聚类
14.3.1 模型
14.3.2 策略
14.3.3 算法
14.3.4 算法特点
本章概要
继续阅读
习题
参考文献
第15章 奇异值分解
15.1 奇异值分解的定义与性质
15.1.1 定义与定理
15.1.2 紧奇异值分解与截断奇异值分解
15.1.3 几何解释
15.1.4 主要性质
15.2 奇异值分解的计算
15.3 奇异值分解与矩阵近似
15.3.1 弗罗贝尼乌斯范数
15.3.2 矩阵的优近似
15.3.3 矩阵的外积展开式
本章概要
继续阅读
习题
参考文献
第16章 主成分分析
16.1 总体主成分分析
16.1.1 基本想法
16.1.2 定义和导出
16.1.3 主要性质
16.1.4 主成分的个数
16.1.5 规范化变量的总体主成分
16.2 样本主成分分析
16.2.1 样本主成分的定义和性质
16.2.2 相关矩阵的特征值分解算法
16.2.3 数据局正的奇异值分解算法
本章概要
继续阅读
习题
参考文献
第17章 潜在语义分析
17.1 单词向量空间与话题向量空间
17.1.1 单词向量空间
17.1.2 话题向量空间
17.2 潜在语义分析算法
17.2.1 矩阵奇异值分解算法
17.2.2 例子
17.3 非负矩阵分解算法
17.3.1 非负矩阵分解
17.3.2 潜在语义分析模型
17.3.3 非负矩阵分解的形式化
17.3.4 算法
本章概要
继续阅读
习题
参考文献
第18章 概率潜在语义分析
18.1 概率潜在语义分析模型
18.1.1 基本想法
18.1.2 生成模型
18.1.3 共现模型
18.1.4 模型性质
18.2 概率潜在语义分析的算法
本章概要
继续阅读
习题
参考文献
第19章 马尔可夫链蒙特卡罗法
19.1 蒙特卡罗法
19.1.1 随机抽样
19.1.2 数学期望估计
19.1.3 积分计算
19.2 马尔可夫链
19.2.1 基本定义
19.2.2 离散状态马尔可夫链
19.2.3 连续状态马尔可夫链
19.2.4 马尔可夫链的性质
19.3 马尔可夫链蒙特卡罗法
19.3.1 基本想法
19.3.2 基本步骤
19.3.3 马尔可夫链蒙特卡罗法与统计学习
19.4 Metropolis-Hastings算法
19.4.1 基本原理
19.4.2 Metropolis-Hastings算法
19.4.3 单分量Metropolis-Hastings算法
19.5 吉布斯抽样
19.5.1 基本原理
19.5.2 吉布斯抽样算法
19.5.3 抽样计算
本章概要
继续阅读
习题
参考文献
第20章 潜在狄利克雷分配
20.1 狄利克雷分布
20.1.1 分布定义
20.1.2 共轭先验
20.2 潜在狄利克雷分配模型
20.2.1 基本想法
20.2.2 模型定义
20.2.3 概率图模型
20.2.4 随机变量序列的可交换性
20.2.5 概率公式
20.3 LDA的吉布斯抽样算法
20.3.1 基本想法
20.3.2 算法的主要部分
20.3.3 算法的后处理
20.3.4 算法
20.4 LDA的变分EM算法
20.4.1 变分推理
20.4.2 变分EM算法
20.4.3 算法推导
20.4.4 算法总结
本章概要
继续阅读
习题
参考文献
第21章 PageRank算法
21.1 PageRank的定义
21.1.1 基本想法
21.1.2 有向图和随机游走模型
21.1.3 PageRank的基本定义
21.1.4 PageRank的一般定义
21.2 PageRank的计算
21.2.1 迭代算法
21.2.2 幂法
21.3.3 代数算法
本章概要
继续阅读
习题
参考文献
第22章 无监督学习方法总结
22.1 无监督学习方法的关系和特点
22.1.1 各种方法之间的关系
22.1.2 无监督学习方法
22.1.3 基础及其学习方法
22.2 话题模型之间的关系和特点
参考文献
附录A 梯度下降法
附录B 牛顿法和拟牛顿法
附录C 拉格朗日对偶性
附录D 矩阵的基本子空间
附录E KL散度的定义和狄利克雷分布的性质
索引
内容简介
统计学习方法即机器学习方法,是计算机及其应用领域的一门重要学科。本书分为监督学 习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k 近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM 算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔可夫链蒙特卡罗法、潜在狄利克雷分配和 PageRank 算法等。除有关统计学习、监督学习和无监督学习的概论和总结的四章外,每章介绍一种方法。叙述力求从具体问题或实例入手, 由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。 为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。 本书是统计机器学习及相关课程的教学参考书,适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,也可供从事计算机应用相关专业的研发人员参考。
下载说明
1、统计学习方法(第2版)是作者李航创作的原创作品,下载链接均为网友上传的网盘链接!
2、相识电子书提供优质免费的txt、pdf等下载链接,所有电子书均为完整版!
下载链接
热门评论
-
肉粽的评论比周志华的西瓜书强了不是一星半点,循循善诱,简直打开了任督二脉,强推
-
王小二的评论已然98一本了 不知道是知识涨价了 还是出版业无奈的挣扎 只能理解着去图书馆抢资源了。
-
Dorian的评论中式教材,不适合初学者读。所有算法都是只讲道理,不讲故事,如果不了解背景故事,真的很难明白到底这些算法能拿来干嘛。
-
马脸兔砸的评论没有第一版便携了,新增内容大部分是nlp相关,太基础了,失落
-
Salooloo的评论国内最好的教材。
-
抢萝卜的喵的评论统计学习教材经典中的经典
-
myosotis的评论特别棒,绝大部分部分内容清晰明了,还有非常丰富的扩展阅读,不过大多都是传统机器学习内容,如果再加上一本专门讲神经网络深度学习的书的话才算是把目前主流机器学习内容学全。
-
Coelacanth的评论很中国特色的”参考书“。相当言简意赅,第二版加了无监督学习部分以后直接厚了快一倍……这本书个人觉得适合拿来回顾夯实基础串联知识点。有基础以后再读,按着书上思路自己动手推一遍的收获会相当大。至于拿来入门还是算了吧……说起来入门机器学习干嘛非要扣参考书呢……跟着课程看幻灯片做课后习题难道不是要舒服许多吗。
-
理性的光辉的评论严谨,详实,全面,对于想了解统计学在机器学习中的应用的人而言是一本较好的参考书
-
abyzsin的评论看到第十六章主成分分析,后面的部分一方面有点难,一方面由于其他原因很难再坚持看下去了。但是个人觉得本书要比西瓜书讲原理要好很多,希望想走相关领域的兄弟姐妹早早入坑。
-
祝天宏的评论读完前16章,经典算法推导详实,与西瓜书相比在深度上胜之,但广度不及
-
JFan的评论很中国
-
RJW的评论看过的最棒的机器学习入门书了。千万不要被公式吓到,一步一步慢慢来,会搞出来的。
-
时间戳的评论好书
-
olostin的评论没有第一版惊艳。手推SVM是八股,但真的挺好玩的。
-
夜行山人的评论偏入门但又很难啃得动的机器学习统计算法书,不过教材确实更好理解。
-
The Thing的评论相比第一版 增加了很多新内容 更加丰富了
-
量子态的观测者的评论从第二篇无监督学习开始新内容
-
的评论主要看了新增的无监督学习部分,说实话新增加的内容有点儿水,价格倒是涨了不少。
-
芩年的评论拥有 但没仔细读