文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

【李沐】动手学深度学习 学习笔记

2023-08-31 10:40

关注

目录

【内容介绍】动手学深度学习-基于pytorch版本

你好! 这是【李沐】动手学深度学习v2-基于pytorch版本的学习笔记
教材
源代码
安装教程(安装pytorch不要用pip,改成conda,pip太慢了,下载不下来)
个人推荐学习学习笔记

【脉络梳理】

预备知识

数据操作

  本节代码文件在源代码文件的chapter_preliminaries/ndarray.ipynb中

数据预处理

  本节代码文件在源代码文件的chapter_preliminaries/pandas.ipynb中

线性代数

  本节代码文件在源代码文件的chapter_preliminaries/linear-algebra.ipynb中

矩阵计算

  本节代码文件在源代码文件的chapter_preliminaries/calculus.ipynb中

自动求导

  本节代码文件在源代码文件的chapter_preliminaries/autograd.ipynb中

    样例:
      反向累积模式样例

线性神经网络

线性回归

  本节代码文件在源代码文件的chapter_linear-networks/linear-regression.ipynb中

深度学习的基础优化算法

线性回归的从零开始实现

  本节代码文件在源代码文件的chapter_linear-networks/linear-regression-scratch.ipynb中

生成数据集 读取数据集 初始化模型参数 定义模型 训练

  其中,定义模型包括定义损失函数和定义优化算法

线性回归的简洁实现

  本节代码文件在源代码文件的chapter_linear-networks/linear-regression-concise.ipynb中
  简洁实现是指通过使用深度学习框架来实现线性回归模型,具体流程与从零开始实现大体相同,不过一些常用函数不需要我们自己写了(直接导库,用别人写好的)

生成数据集 读取数据集 定义模型 初始化模型参数 训练

Softmax回归

  本节代码文件在源代码文件的chapter_linear-networks/softmax-regression.ipynb中

损失函数

  本节代码文件在源代码文件的chapter_linear-networks/softmax-regression.ipynb中
损失函数用来衡量预测值与真实值之间的区别,是机器学习里非常重要的概念。下面介绍三种常用的损失函数。

图像分类数据集

  本节代码文件在源代码文件的chapter_linear-networks/image-classification-dataset.ipynb中

Softmax回归的从零开始实现

  本节代码文件在源代码文件的chapter_linear-networks/softmax-regression-scratch.ipynb中

初始化模型参数 定义softmax操作 定义模型 定义损失函数 分类精度 训练 预测

    分类精度即正确预测数量与总预测数量之比

Softmax回归的简洁实现

  本节代码文件在源代码文件的chapter_linear-networks/softmax-regression-concise.ipynb中
  通过深度学习框架的高级API也能更方便地实现softmax回归模型。

初始化模型参数 定义损失函数 优化算法 训练 预测

多层感知机

感知机

多层感知机

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/mlp.ipynb中

多层感知机的从零开始实现

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/mlp-scratch.ipynb中

初始化模型参数 激活函数 模型 损失函数 训练

多层感知机的简洁实现

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/mlp-concise.ipynb中

模型选择

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/underfit-overfit.ipynb中

过拟合和欠拟合

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/underfit-overfit.ipynb中

    VC 维

权重衰退

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/weight-decay.ipynb中
  权重衰退是一种常见的处理过拟合(模型复杂度过高)的方法

暂退法(Dropout)

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/dropout.ipynb中

数值稳定性

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/numerical-stability-and-init.ipynb中

模型初始化和激活函数

  本节代码文件在源代码文件的chapter_multilayer-perceptrons/numerical-stability-and-init.ipynb中

深度学习计算

层和块

  本节代码文件在源代码文件的chapter_deep-learning-computation/model-construction.ipynb中

参数管理

  本节代码文件在源代码文件的chapter_deep-learning-computation/parameters.ipynb中

自定义层

  本节代码文件在源代码文件的chapter_deep-learning-computation/custom-layer.ipynb中

读写文件

  本节代码文件在源代码文件的chapter_deep-learning-computation/read-write.ipynb中

  有时我们希望保存训练的模型, 以备将来在各种环境中使用(比如在部署中进行预测)。 此外,当运行一个耗时较长的训练过程时, 最佳的做法是定期保存中间结果, 以确保在服务器电源被不小心断掉时,我们不会损失几天的计算结果。

卷积神经网络

从全连接层到卷积

  本节代码文件在源代码文件的chapter_convolutional-neural-networks/why-conv.ipynb中

图像卷积

  本节代码文件在源代码文件的chapter_convolutional-neural-networks/conv-layer.ipynb中

填充和步幅

  本节代码文件在源代码文件的chapter_convolutional-neural-networks/padding-and-strides.ipynb中

  填充和步幅是卷积层的两个控制输出大小的超参数

多输入多输出通道

  本节代码文件在源代码文件的chapter_convolutional-neural-networks/channels.ipynb中

池化层(汇聚层)

  本节代码文件在源代码文件的chapter_convolutional-neural-networks/pooling.ipynb中

LeNet

  本节代码文件在源代码文件的chapter_convolutional-neural-networks/lenet.ipynb中

现代卷积神经网络

深度卷积神经网络(AlexNet)

  本节代码文件在源代码文件的chapter_convolutional-modern/alexnet.ipynb中

使用块的网络(VGG)

  本节代码文件在源代码文件的chapter_convolutional-modern/vgg.ipynb中

网络中的网络(NiN)

  本节代码文件在源代码文件的chapter_convolutional-modern/nin.ipynb中

含并行连结的网络(GoogLeNet)

  本节代码文件在源代码文件的chapter_convolutional-modern/googlenet.ipynb中

批量规范化(归一化)

  本节代码文件在源代码文件的chapter_convolutional-modern/batch-norm.ipynb中

残差网络(ResNet)

  本节代码文件在源代码文件的chapter_convolutional-modern/resnet.ipynb中

计算性能

深度学习硬件(CPU和GPU)

深度学习硬件(TPU和其他)

单机多卡并行

分布式训练

计算机视觉

图像增广

  本节代码文件在源代码文件的chapter_computer-vision/image-augmentation.ipynb中

微调

  本节代码文件在源代码文件的chapter_computer-vision/fine-tuning.ipynb中

物体检测和数据集

  本节代码文件在源代码文件的chapter_computer-vision/bounding-box.ipynb中

锚框

  本节代码文件在源代码文件的chapter_computer-vision/anchor.ipynb中

物体检测算法:R-CNN,SSD,YOLO

  本节代码文件在源代码文件的chapter_computer-vision/rcnn.ipynb中

单发多框检测(SSD)

  本节代码文件在源代码文件的chapter_computer-vision/ssd.ipynb中

YOLO

语义分割

  本节代码文件在源代码文件的chapter_computer-vision/semantic-segmentation-and-dataset.ipynb中

转置卷积

  本节代码文件在源代码文件的chapter_computer-vision/transposed-conv.ipynb中

全连接卷积神经网络 FCN

  本节代码文件在源代码文件的chapter_computer-vision/fcn.ipynb中

样式迁移

  本节代码文件在源代码文件的chapter_computer-vision/neural-style.ipynb中

循环神经网络

序列模型

  本节代码文件在源代码文件的chapter_recurrent-neural-networks/sequence.ipynb中

语言模型

  本节代码文件在源代码文件的chapter_recurrent-neural-networks/language-models-and-dataset.ipynb中

循环神经网络

  本节代码文件在源代码文件的chapter_recurrent-neural-networks/rnn.ipynb中

现代循环神经网络

门控循环单元GRU

  本节代码文件在源代码文件的chapter_recurrent-modern/gru.ipynb中

长短期记忆网络(LSTM)

  本节代码文件在源代码文件的chapter_recurrent-modern/lstm.ipynb中

深度循环神经网络

  本节代码文件在源代码文件的chapter_recurrent-modern/deep-rnn.ipynb中

双向循环神经网络

  本节代码文件在源代码文件的chapter_recurrent-modern/bi-rnn.ipynb中

编码器-解码器

  本节代码文件在源代码文件的chapter_recurrent-modern/encoder-decoder.ipynb中

序列到序列学习

  本节代码文件在源代码文件的chapter_recurrent-modern/seq2seq.ipynb中

束搜索

  本节代码文件在源代码文件的chapter_recurrent-modern/beam-search.ipynb中

注意力机制

  本节代码文件在源代码文件的chapter_attention-mechanisms/attention-cues.ipynb中

注意力分数

  本节代码文件在源代码文件的chapter_attention-mechanisms/attention-scoring-functions.ipynb中

使用注意力机制的seq2seq

  本节代码文件在源代码文件的chapter_attention-mechanisms/bahdanau-attention.ipynb中

自注意力

  本节代码文件在源代码文件的chapter_attention-mechanisms/self-attention-and-positional-encoding.ipynb中

Transformer

  本节代码文件在源代码文件的chapter_attention-mechanisms/transformer.ipynb中

自然语言处理:预训练

BERT预训练

  本节代码文件在源代码文件的chapter_natural-language-processing-pretraining/bert-pretraining.ipynb中

自然语言处理:应用

BERT微调

  本节代码文件在源代码文件的chapter_natural-language-processing-applications/finetuning-bert.ipynb中

优化算法

优化算法

  本节代码文件在源代码文件的chapter_optimization/optimization-intro.ipynb中

来源地址:https://blog.csdn.net/chenxiaowai_/article/details/124537066

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     807人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     351人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     314人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     433人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     221人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯