GitHub - reganzm/Learn-Pytorch-And-Become-A-Data-Scientist: 《学好Pytorch成为数据科学家》书籍随书代码

第1章  初识Pytorch	11

1.1 AI发展简史 12
- 1.1.1 神经网络的前世今生 12
- 1.1.2 深度学习框架对比 13
1.2 环境安装 16
- 1.2.1 Python版本选择及安装 16
- 1.2.2 安装Pytorch1.2稳定版 18
- 1.2.3 开发环境IDE 19
1.3 Pytorch核心概念 20
- 1.3.1基本概念 20
- 1.3.2自动微分 24
- 1.3.3 Pytorch核心模块 26
1.4 实验室小试牛刀 27
- 1.4.1塔珀自指公式 27
- 1.4.2看看你毕业了能拿多少 28
1.5 课后加油站高等数学知识回顾 43
- 1.5.1 函数与导数 43
- 1.5.2 偏导数及梯度 47

第2章 机器学习基础及常见概念	50

2.1 机器学习的分类 51
- 2.1.1 监督学习 51
- 2.1.2 半监督学习 52
- 2.1.3 无监督学习 52
- 2.1.4 强化学习 53
2.2 机器学习常见概念 54
- 2.2.1 缺失值处理 54
- 2.2.2 数据标准化与正则化 56
- 2.2.3 交叉验证 58
- 2.2.4 过拟合和欠拟合 60
2.3 神经网络 61
- 2.3.1 神经网络的生理学发现与编程模拟 61
- 2.3.2 人工神经网络的核心思想 67
- 2.3.3 人工神经网络与逻辑斯蒂之间的关联 68
2.4实现线性回归和逻辑回归 68
- 2.4.1 Pytorch实现线性回归 68
- 2.4.2 Pytorch实现多项式回归 70
- 2.4.3 Pytorch实现类逻辑回归 73
2.5 加油站高等数学知识回顾 77
- 2.5.1 方向导数和梯度 77
- 2.5.2 微分及积分 79
- 2.5.3 牛顿-莱布尼兹公式 82

第3章 Pytorch与科学计算	83

第4章 激活函数、损失函数、优化器及数据加载	125

4.1 激活函数 126
- 4.1.1 Sigmoid 126
- 4.1.2 Tanh 128
- 4.1.3 Relu及其变形 129
- 4.1.4 MaxOut 132
4.2 损失函数 133
- 4.2.1 L1范数损失 134
- 4.2.2 MSE均方误差损失 134
- 4.2.3 BCE二分类交叉熵损失 135
- 4.2.4 CrossEntropyLoss和NLLLoss计算交叉熵损失 135
- 4.2.5 KL散度损失 136
- 4.2.6 余弦相似度损失 137
- 4.2.7 多分类多标签损失 138
4.3 优化器 139
- 4.3.1 BGD 139
- 4.3.2 SGD 139
- 4.3.3 MBGD 140
- 4.3.4 Momentum 141
- 4.3.5 NAG 142
- 4.3.6 Adagrad 143
- 4.3.7 Adadelta 143
- 4.3.8 Adam 144
4.4 数据加载 145
- 4.4.1 Dataset数据集 145
- 4.4.2 DataLoader数据加载 148
4.5 初探卷积神经网络 149
- 4.5.1 知识科普：卷积过程及物理意义 149
- 4.5.2 卷积神经网络CNN 153
- 4.5.3 stride和padding 158
- 4.5.4 膨胀卷积神经网络 159
- 4.5.5 Pooling池化 161
4.6 实验室小试牛刀 164
- 4.6.1 设计卷积神经网络 164
- 4.6.2 定义卷积网络 164
- 4.6.3 训练模型 165
- 4.6.4 理解CNN在学什么 168

第5章 Pytorch深度神经网络	177

5.1 计算机视觉工具包 177
5.2 训练过程的可视化 179
- 5.2.1 Tensorboard 179
- 5.2.2 Visdom 184
5.3 深度神经网络 186
- 5.3.1 LeNet 187
- 5.3.2 AlexNet 188
- 5.3.3 ZF-Net 190
- 5.3.4 VGG-Nets 191
- 5.3.5 GoogLeNet 194
- 5.3.6 ResNet 196
- 5.3.7 DenseNet 197
5.4 RNN循环神经网络 199
- 5.4.1 RNN 199
- 5.4.2 LSTM 203
- 5.4.3 GRU 207
5.5 实验室小试牛刀 209
- 5.5.1 数据准备 209
- 5.5.2 GRU网络设计 211
- 5.5.3 训练模型 212
- 5.5.4 模型预测 213
5.6 加油站之概率论基础知识回顾 214
- 5.6.1 离散型随机变量和连续型随机变量 214
- 5.6.2 概率论常用概念 219
- 5.6.3 二维随机变量 220
- 5.6.4 边缘分布 223
- 5.6.5 期望和方差 224
- 5.6.6 大数定理 225
- 5.6.7 马尔科夫不等式及切比雪夫不等式 226
- 5.6.8 中心极限定理 227

第6章 自然语言处理	227

6.1 自然语言基础 227
- 6.1.1 自然语言发展史 228
- 6.1.2 自然语言处理中的常见任务 230
- 6.1.3 统计自然语言理论 232
- 6.1.4 隐马尔可夫模型实现中文分词 240
6.2 关键字提取 242
- 6.2.1 TF-IDF 243
- 6.2.2 TextRank 244
- 6.2.3 主题模型 245
6.3 Word2vec和词嵌入 246
- 6.3.1 N-Gram模型 246
- 6.3.2 词袋模型 247
- 6.3.3 Word2vec词向量的密集表示 248
- 6.3.4 使用Word2vec生成词向量 255
- 6.3.5 Word2vec源码调试 256
- 6.3.6 Pytorch中使用词向量 256
6.4 变长序列处理 258
- 6.4.1 pack_padded_sequence压缩 259
- 6.4.2 pad_packed_sequence解压缩 261
6.5 Encoder-Decoder框架和注意力机制 262
- 6.5.1 Encoder-Decoder框架 262
- 6.5.2 Attention Mechanism注意力机制 263
6.6 实验室小试牛刀对话机器人 266
- 6.6.1 中文对话语料 266
- 6.6.2 构建问答词典 267
- 6.6.3 DataLoader数据加载 268
- 6.6.4 Encoder双向多层GRU 271
- 6.6.5 Attention注意力机制 272
- 6.6.6 Decoder多层GRU 273
- 6.6.7 模型训练 274
- 6.6.8 答案搜索及效果展示 276
6.7 加油站之常见的几种概率分布 277
- 6.7.1 二项分布 277
- 6.7.2 正态分布 278
- 6.7.3 均匀分布 279
- 6.7.4 泊松分布 280
- 6.7.5 卡方分布 282
- 6.7.6 Beta分布 283

第7章 自然语言的曙光预训练模型	284

第8章 自然语言处理利器AllenNLP	295

第9章 FastAI高层深度学习框架	307

第10章 Pytorch Big Graph大型图嵌入	314

10.1 Pytorch Big Graph简介 315
- 10.1.1 PBG模型 315
- 10.1.2 模型的表示 316
- 10.1.3 正负样本及损失函数 317
- 10.1.4 分布式训练 317
- 10.1.5 批量负采样 318
10.2 PBG实践应用 319
- 10.2.1 模型配置文件 320
- 10.2.2 划分训练集和测试集 321
- 10.2.3 模型训练和验证 322
- 10.2.4 图嵌入向量及应用 323

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
chapter1		chapter1
chapter10/PBG		chapter10/PBG
chapter2		chapter2
chapter3		chapter3
chapter4		chapter4
chapter5		chapter5
chapter6		chapter6
chapter7		chapter7
chapter8		chapter8
chapter9		chapter9
README.md		README.md
gongzhonghao.jpg		gongzhonghao.jpg

Provide feedback