章节目录
前言
第1章 机器视觉在行业中的应用1
1.1 机器视觉的发展背景1
1.1.1 人工智能1
1.1.2 机器视觉2
1.2 机器视觉的主要应用场景3
1.2.1 人脸识别3
1.2.2 视频监控分析4
1.2.3 工业瑕疵检测5
1.2.4 图片识别分析6
1.2.5 自动驾驶/驾驶辅助7
1.2.6 三维图像视觉8
1.2.7 医疗影像诊断8
1.2.8 文字识别9
1.2.9 图像/视频的生成及设计9
1.3 本章小结10
第2章 图像识别前置技术11
2.1 深度学习框架11
2.1.1 Theano11
2.1.2 Tensorflow12
2.1.3 MXNet13
2.1.4 Keras13
2.1.5 PyTorch14
2.1.6 Caffe14
2.2 搭建图像识别开发环境15
2.2.1 Anaconda15
2.2.2 conda18
2.2.3 Pytorch的下载与安装19
2.3 Numpy使用详解20
2.3.1 创建数组20
2.3.2 创建Numpy数组22
2.3.3 获取Numpy属性24
2.3.4 Numpy数组索引25
2.3.5 切片25
2.3.6 Numpy中的矩阵运算26
2.3.7 数据类型转换27
2.3.8 Numpy的统计计算方法28
2.3.9 Numpy中的arg运算29
2.3.10 FancyIndexing29
2.3.11 Numpy数组比较30
2.4 本章小结31
第3章 图像分类之KNN算法32
3.1 KNN的理论基础与实现32
3.1.1 理论知识32
3.1.2 KNN的算法实现33
3.2 图像分类识别预备知识35
3.2.1 图像分类35
3.2.2 图像预处理36
3.3 KNN实战36
3.3.1 KNN实现MNIST数据分类36
3.3.2 KNN实现Cifar10数据分类41
3.4 模型参数调优44
3.5 本章小结48
第4章 机器学习基础49
4.1 线性回归模型49
4.1.1 一元线性回归50
4.1.2 多元线性回归56
4.2 逻辑回归模型57
4.2.1 Sigmoid函数58
4.2.2 梯度下降法59
4.2.3 学习率的分析61
4.2.4 逻辑回归的损失函数63
4.2.5 Python实现逻辑回归66
4.3 本章小结68
第5章 神经网络基础69
5.1 神经网络69
5.1.1 神经元70
5.1.2 激活函数72
5.1.3 前向传播76
5.2 输出层80
5.2.1 Softmax80
5.2.2 one-hotencoding82
5.2.3 输出层的神经元个数83
5.2.4 MNIST数据集的前向传播83
5.3 批处理85
5.4 广播原则87
5.5 损失函数88
5.5.1 均方误差88
5.5.2 交叉熵误差89
5.5.3 Mini-batch90
5.6 最优化91
5.6.1 随机初始化91
5.6.2 跟随梯度(数值微分)92
5.7 基于数值微分的反向传播98
5.8 基于测试集的评价101
5.9 本章小结104
第6章 误差反向传播105
6.1 激活函数层的实现105
6.1.1 ReLU反向传播实现106
6.1.2 Sigmoid反向传播实现106
6.2 Affine层的实现107
6.3 Softmaxwithloss层的实现108
6.4 基于数值微分和误差反向传播的比较109
6.5 通过反向传播实现MNIST识别111
6.6 正则化惩罚114
6.7 本章小结115
第7章 PyTorch实现神经网络图像分类116
7.1 PyTorch的使用116
7.1.1 Tensor116
7.1.2 Variable117
7.1.3 激活函数118
7.1.4 损失函数120
7.2 PyTorch实战122
7.2.1 PyTorch实战之MNIST分类122
7.2.2 PyTorch实战之Cifar10分类125
7.3 本章小结128
第8章 卷积神经网络129
8.1 卷积神经网络基础129
8.1.1 全连接层129
8.1.2 卷积层130
8.1.3 池化层134
8.1.4 批规范化层135
8.2 常见卷积神经网络结构135
8.2.1 AlexNet136
8.2.2 VGGNet138
8.2.3 GoogLeNet140
8.2.4 ResNet142
8.2.5 其他网络结构144
8.3 VGG16实现Cifar10分类145
8.3.1 训练146
8.3.2 预测及评估149
8.4 本章小结152
8.5 参考文献152
第9章 目标检测153
9.1 定位+分类153
9.2 目标检测155
9.2.1 R-CNN156
9.2.2 Fast R-CNN160
9.2.3 Faster R-CNN162
9.2.4 YOLO165
9.2.5 SSD166
9.3 SSD实现VOC目标检测167
9.3.1 PASCAL VOC数据集167
9.3.2 数据准备170
9.3.3 构建模型175
9.3.4 定义Loss178
9.3.5 SSD训练细节181
9.3.6 训练186
9.3.7 测试189
9.4 本章小结190
9.5 参考文献191
第10章 分割192
10.1 语义分割193
10.1.1 FCN193
10.1.2 UNet实现裂纹分割196
10.1.3 SegNet209
10.1.4 PSPNet210
10.2 实例分割211
10.2.1 层叠式212
10.2.2 扁平式212
10.3 本章小结213
10.4 参考文献214
第11章 产生式模型215
11.1 自编码器215
11.2 对抗生成网络215
11.3 DCGAN及实战217
11.3.1 数据集218
11.3.2 网络设置220
11.3.3 构建产生网络221
11.3.4 构建判别网络223
11.3.5 定义损失函数224
11.3.6 训练过程224
11.3.7 测试227
11.4 其他GAN230
11.5 本章小结235
11.6 参考文献235
第12章 神经网络可视化236
12.1 卷积核236
12.2 特征层237
12.2.1 直接观测237
12.2.2 通过重构观测239
12.2.3 末端特征激活情况243
12.2.4 特征层的作用244
12.3 图片风格化245
12.3.1 理论介绍245
12.3.2 代码实现247
12.4 本章小结255
12.5 参考文献255
第13章 图像识别算法的部署模式257
13.1 图像算法部署模式介绍257
13.2 实际应用场景和部署模式的匹配262
13.3 案例介绍264
13.4 本章小结265
内容简介
这是一部从技术原理、算法和工程实践3个维度系统讲解图像识别的著作,由阿里巴巴达摩院算法专家、阿里巴巴技术发展专家、阿里巴巴数据架构师联合撰写。
在知识点的选择上,本书广度和深度兼顾,既能让完全没有基础的读者迅速入门,又能让有基础的读者深入掌握图像识别的核心技术;在写作方式上,本书避开了复杂的数学公式及其推导,从问题的前因后果 、创造者的思考过程,利用简单的数学计算来做模型分析和讲解,通俗易懂。更重要的是,本书不仅仅是聚焦于技术,而是将重点放在了如何用技术解决实际的业务问题。
全书一共13章:
第1-2章主要介绍了图像识别的应用场景、工具和工作环境的搭建;
第3-6章详细讲解了图像分类算法、机器学习、神经网络、误差反向传播等图像识别的基础技术及其原理;
第7章讲解了如何利用PyTorch来实现神经网络的图像分类,专注于实操,是从基础向高阶的过渡;
第8-12章深入讲解了图像识别的核心技术及其原理,包括卷积神经网络、目标检测、分割、产生式模型、神经网络可视化等主题;
第13章从工程实践的角度讲解了图像识别算法的部署模式。
购买本书的读者请在http://www.hzcourse.com/web/refbook/detail/8376/226
下载源代码
下载说明
1、深度学习与图像识别:原理与实践是作者魏溪含 涂铭 张修鹏 著创作的原创作品,下载链接均为网友上传的网盘链接!
2、相识电子书提供优质免费的txt、pdf等下载链接,所有电子书均为完整版!
下载链接
热门评论
-
杰尼恶霸的评论别的错我都能忍,可是说好的源码的github地址是错的,这个就很过分了
-
花洒洒的评论模型超多!模型超多!模型超多!重要的问题说三遍!这本书真的是我读过的最好读的了,一点都不费力气,都是具现化的模型,也没有很复杂的那种满篇的计算过程和代码,基本上是从思想上培育架构的,对于我这种半吊子来说真是太舒服了。
-
迷信的鸽子的评论8月8号的评论点进个人主页一看全是该出版社的五星评论,这套丛书好多都是有水军在刷分,还卖的死贵死贵。
-
喜努比的评论(读文学书没用,确实没用。 没用就没用在让你觉得自己比别人有文化。但其实不过是比普通人多知道一些“就算不知道也饿不死”的事实而已。) 而读专业书有用,真的有用。 有用就有用在读了半天,能发现自己真的是个傻子。人还是贵在自知。我天天这样读到半夜,今天突然顿悟了:原来我没长脑子。
-
DreamAndDead的评论不够深入,应用样例值得一看
-
xiaopangpang的评论很贵,花了近100块,在学校时候买的,光看达摩院招牌了。pytorch入门也可以,稍微了解下深度学习也还行,代码还好,就是有些小差错,少了import或者少了些function注明。
-
这里没有一言堂的评论书读完了,内容非常不错,给五星。前半部分内容浅显易懂,很适合入门,后半部分内容比较有深度,贴合实际的实战场景。
-
康生的评论真的不行,就这本书还能上8我看是水军刷上去的吧。首先讲得很浅,其次没有把原理讲清楚,没有重点,只是流水账式的堆砌步骤和公式。,最后整本书感觉像是东拼西凑出来的。
-
Cursed的评论代码错误先不提,源码地址也错了,唯一可取就是讲解的还行
-
王见现的评论这本书用代码完整实现了各种深度学习的算法,非常简洁明了,让人看过就会想动手实操,优秀的作品。
-
Teemo的评论买了涂铭老师写的《Python自然语言里处理实战》,内容不错,这本书也果断买了,内容质量又上了一个新台阶,已经成为涂铭老师的忠粉了。
-
天天好心情的评论书收到了,还没来得及看,彩色印刷,很精致,很漂亮,纸张也不错,难怪价格有点贵,希望内容不要让我失望。
-
Ethan井的评论读着读着,发现作者在图像识别领域都是好年轻的“老司机”啊!字里行间充满了丰富的工程经验,而且越往后越深度挖掘了深度学习的内涵,佩服佩服!
-
千明的评论日常生活中越来越多的应用场景中用到了深度学习,正好想看看相关的图书充充电。这本书是图像识别领域的交叉作品,原理算法和实践结合得挺好,哪怕是当个案例书读读都比较长见识,挺不错的。
-
小超的评论这本书还算不错,但是源代码网站打不开......
-
sissi的评论这本书有些部分的内容讲得有些浅显,可能是照顾到没有太多基础的读者,不过并不会觉得幼稚。对图像识别的各种应用场景以及神经网络的分类都进行了详述,算是详略得当吧,有基础的读者建议对照目录挑着感兴趣的模块来看,实战性蛮强的。
-
温洪亮的评论作为一个图像识别方面的新人,感觉这本书就是为我量身定做的,看起来毫无障碍。
-
plugin1689的评论书的前半部分是抄袭的, 后面更是各种examples拼凑起来, 但是你倒提供个有效的github链接啊, 难道作者自己心虚不成? 各种解释不清, 比如第十章分割用了一个马路crack detection的数据集, seg文件在哪用起来的? 这么重要的mask提都没提, 怎么让人复现, 那么薄的一本书卖那么贵, 还到处抄袭, 到处错误, 到处缺这缺那, 骗钱而已...
-
姜湖成哥的评论绝对不推荐的一本书。。。 写的真的很一般的一本书,价格还死贵的。类似的书这两年没有出版100本,至少也出版了几十本。第一章简介,网上随便搜一下博客就很多;第二章只要是深度学习、机器学习的书都会讲一点(框架、numpy);第三章KNN算法,这个很多深度学习实战的书基本上都会讲到;4、5、6三章基础内容,机器学习、深度学习的书都会介绍;后面100来页的8、9、10、11、12、13章基本上也是介绍现有的一些论文、框架、实现方法等,没有自我的什么干货。估计国内高校勤奋一点的研究生、博士生整整论文也能写出类似的东东。 达摩院出这样的书,看不出跟网上培训机构的深度学习、机器视觉视频课程有什么大的区别。
-
Coxswain的评论这本书下面日期在2019-08-08左右的评论都不用看了,水军一票