章节目录
理 论 篇
第1章 你必须知道的一些基础知识………………………………………3
1.1 概率论 ……………………………………………………………3
1.2 信息论 ……………………………………………………………4
1.3 贝叶斯法则 ………………………………………………………7
1.4 问题与思考 ………………………………………………………10
第2章 我们生活在一个寻求最优解的世界里……………………………11
2.1 最优化问题 ………………………………………………………11
2.2 最大似然估计/最大后验估计 …………………………………15
2.3 梯度下降法 ………………………………………………………17
2.4 问题与思考 ………………………………………………………22
第3章 让机器可以像人一样学习…………………………………………23
3.1 何谓机器学习 ……………………………………………………23
3.2 逻辑回归/因子分解机 …………………………………………29
3.3 最大熵模型/条件随机场 ………………………………………34
3.4 主题模型 …………………………………………………………40
3.5 深度学习 …………………………………………………………50
3.6 其他模型 …………………………………………………………88
3.7 问题与思考 ………………………………………………………97
应 用 篇
第4章 如何计算得更快…………………………………………………101
4.1 程序优化 ………………………………………………………101
4.2 分布式系统 ……………………………………………………105
4.3 Hadoop …………………………………………………………107
4.4 问题与思考 ……………………………………………………114
第5章 你要知道的一些术语……………………………………………115
5.1 tf/df/idf …………………………………………………………115
5.2 IG/CHI/MI ………………………………………………………116
5.3 PageRank ………………………………………………………118
5.4 相似度计算 ……………………………………………………119
5.5 问题与思考 ……………………………………………………125
第6章 搜索引擎是什么玩意儿…………………………………………126
6.1 搜索引擎原理 …………………………………………………126
6.2 搜索引擎架构 …………………………………………………129
6.3 搜索引擎核心模块 ……………………………………………130
6.4 搜索广告 ………………………………………………………148
6.5 问题与思考 ……………………………………………………153
第7章 如何让机器猜得更准……………………………………………155
7.1 基于协同过滤的推荐算法 ……………………………………156
7.2 基于内容的推荐算法 …………………………………………158
7.3 混合推荐算法 …………………………………………………159
7.4 问题与思考 ……………………………………………………163
第8章 理解语言有多难…………………………………………………164
8.1 自然语言处理 …………………………………………………164
8.2 对话系统 ………………………………………………………176
8.3 语言的特殊性 …………………………………………………186
8.4 问题与思考 ……………………………………………………190
结语…………………………………………………………………………191
参考文献……………………………………………………………………193
内容简介
本书结合作者多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必备的知识和技能。本书主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8章,分别针对计算性能、文本处理的术语、相似度计算、搜索引擎、推荐系统、自然语言处理和对话系统等主题展开介绍和讨论。本书适合从事自然语言处理相关研究和工作的读者参考,尤其适合想要了解和掌握机器学习或者自然语言处理技术的读者阅读。
下载说明
1、文本上的算法——深入浅出自然语言处理是作者路彦雄创作的原创作品,下载链接均为网友上传的网盘链接!
2、相识电子书提供优质免费的txt、pdf等下载链接,所有电子书均为完整版!
下载链接
热门评论
-
[已注销]的评论概要总结。不适合入门,适合有实际经验的阅读。不够深入
-
此间的少年的评论3.5星,前几章不行,后面渐入佳境,看得出来作者是有搜索和推荐领域实际经验又没有放松对业界论文学习的
-
Mihai的评论感觉写的比较散乱。。。都是蜻蜓点水
-
子莒的评论同行衬托,阿里的几个工程师也出了一套书,至少文风上,腾讯的nlp系列略胜一筹。
-
一只黑眼睛看着大千世界的评论涉及数学基础、机器学习基础、搜索、推荐、广告、对话。全书结构不太好,内容有些偏博客,内容覆盖全而新,讲解视角更高。完整读书笔记https://zhuanlan.zhihu.com/p/63783079
-
RUIM的评论全书知识点零散不成系统,但部分知识点简单扼要,涉及深度学习相关;了解到联合概率/条件概率 生成模型/判别模型等等
-
江南的大熊猫的评论看了前2章,如果相关的知识点懂的话,这本书是一个很好的梳理和总结,如果不懂的话呢,那就要去看“更原理性”的其他书了。与周志华的《机器学习》和《统计学习方法》这样的书比起来呢,本书不是通过公式讲算法/模型的原理,而是讲大概的流程及具体的实际应用示例,毕竟这本书不厚,哈哈。
-
Seal Huang的评论通俗易懂
-
续意生的评论还不错吧
-
小基基的评论偏理论,代码少,没python代码。
-
moverzp的评论不适合初学者,信息量略大,但是感觉都是简单地介绍,没做过类似的项目,还是比较难理解的。
-
ColinMacmillan的评论200页拿在手里略为单薄,似乎对不起69元的定价,
-
征程的评论打分的都是水军吗?内容这么浅显,逻辑这么混乱的书也能有这么高的分数?我觉得这本书上的内容写成博客就成了……根本没有成为书的必要。
-
ericuni的评论比较通俗, 但是公式还是有很多不懂的, 不太适合初级入门
-
空的评论非常赞的一本书