机器学习实验笔记

栏目: 数据库 · 发布时间: 5年前

实验1 --- 基于 RNN 的 MNIST 手写字符识别实验

  • 工作流

    预处理(转化为灰度图) --- 卷积 --- 池化 --- 卷积 --- 池化 --- 全连接层 --- softmax --- 输出

  • 简述卷积神经网络要素:卷积核、滤波器、池化、特征图
  • 卷积

    利用卷积操作可以从图像中提取特征

    另外,卷积神经网络CNN,利用到了图像的局部相关性,这样可以减少全连接,减少需要训练的参数

    卷积核相当于一个filter, 卷积核的大小一般采用 3x3 或 5x5

    卷积操作, 相当于把卷积核作为一个 mask, 在像素矩阵上进行滑动, 然后进行加权求和作为特征值, 结果保存为新矩阵的对应像素点, 最后得到的新矩阵就是特征图

    不同的卷积核, 可以提取图片的不同特征, 可以提升图片分类效果

  • 池化

    池化也是一种提取特征的方式, 池化操作的过程和卷积很类似, 但是池化层还可以起到降维的作用。根据参考资料, 这样做的效果之一是增加特征的鲁棒性,减小过拟合

    池化分为平均值池化和最大值池化, 平均池化就是取这个区域的平均值作为特征值, 最大池化则是取最大值作为特征值。

    池化层一般紧跟在卷积层后面。

  • padding

    same padding , 如果滑动窗口在经过某个 stride 后超出了图像范围, 则需要在外面补 0 以继续滑动提取特征值。

    valid padding , 超出范围的就不要了。

  • dropout, 随机丢弃, 防止过拟合, 同时加快训练速度

实验2 --- 基于 RNN 的注册码图像识别实验

  • 工作流

    预处理(转化为灰度图) --- 卷积 --- 池化 --- 卷积 --- 池化 --- 全连接层 --- softmax --- 输出

    总体流程与实验1相同, 不过待识别数字从 1 个变成了 4 个(一起识别), 计算量更大

实验3 --- 基于 LSTM 的图像识别实验

  • 工作流

    预处理(转化为灰度图, 60x160) --- 划分为 160 列 --- LSTM --- 全连接层 --- softmax --- 输出

  • RNN

    Recurrent neural network, 循环神经网络, 在语音识别、自然语言处理、机器翻译、图像描述等领域有广泛应用。

    在处理语音的时候,由于上下文的相关性,需要把一段时间内的语音连起来进行分析,传统的神经网络做不到这一点。也就是说,与时间序列相关的分析和预测通常要用到RNN

    即当前的预测值考虑到了之前的运行结果。

  • 即使只有一层的RNN模型,仍可能出现梯度消失和梯度爆炸,为什么?

    一层RNN模型里面有很多个单元,相当于有很多层的神经元,而不是只有一个神经元。

    RNN在处理长期依赖(时间序列上距离较远的节点)时,距离较远的节点之间的联系时会涉及雅可比矩阵的多次相乘,这会带来梯度消失(经常发生)或者梯度爆炸(较少发生)的问题。不过问题的产生也和激活函数的选择有关,假设选择 y = x 作为激活函数就不会产生梯度消失的问题,当然实际应用中不会这样选择激活函数。

    一般选择 ReLU

  • LSTM与一般的RNN相比,优势在哪?

    LSTM, Long short-term memory, 长短时记忆网络, 是一种特殊结构的 RNN, 能够解决普通 RNN 不能解决的长期依赖问题。

    普通 RNN 会记住久远的东西, 有用的没用的都记住了, 并且不会忘记, 这样会导致这个网络没有选择性。更合理的做法是,记住重要的,把不重要的忘记了。LSTM就是根据这种思想设计的。

    LSTM包含了三个门, Input Gate, Output Gate, Forget Gate. 这三个门是用来控制信号的, 而不是信号直接通过这几个门进出。

    输入信号从上图的最下面输进来, 然后 Input Gate 与输入信号进行相乘, 传给中间的 Cell. 也就是说, 如果这个输入的信号是重要的, 那么 Input Gate 就会让它进来, 如果没什么用, 那么 Input Gate 就不让它进来。Forget Gate 用于衰减信号,Output Gate 用于控制输出比例.

    通过这三个门, LSTM 可以选出重要的信息, 帮助进行信号过滤。

  • GRU 是 LSTM 的一个变体

    • 对 memory 的控制

      LSTM: 用output gate 控制,传输给下一个unit

      GRU:直接传递给下一个unit,不做任何控制


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Head First HTML and CSS

Head First HTML and CSS

Elisabeth Robson、Eric Freeman / O'Reilly Media / 2012-9-8 / USD 39.99

Tired of reading HTML books that only make sense after you're an expert? Then it's about time you picked up Head First HTML and really learned HTML. You want to learn HTML so you can finally create th......一起来看看 《Head First HTML and CSS》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

MD5 加密
MD5 加密

MD5 加密工具

html转js在线工具
html转js在线工具

html转js在线工具