deep learning-如何计算卷积神经网络的参数数量？

2,879 2018-06-27 20:46:41

首先，让我们看一下如何为你拥有的每种单独类型的图层计算可学习参数的数量，然后在示例中计算参数的数量。

输入层：所有输入层所做的都是读取输入图像，因此这里没有可以学习的参数。
卷积层：考虑一个卷积层，该卷积层l在输入处使用要素图，并以k要素图作为输出。过滤器大小为nx m。例如，如下所示：

在此，输入将l=32要素图作为输入，将k=64要素图作为输出，并且过滤器大小为n=3x m=3。重要的是要了解，我们不只是拥有3x3滤镜，而是拥有3x3x32滤镜，因为我们的输入具有32个尺寸。我们学习了64种不同的3x3x32滤镜。因此，权重的总数为n*m*k*l。然后，每个特征图都有一个偏差项，因此我们的参数总数为(n*m*l+1)*k。
池化层：池化层例如执行以下操作：“用其最大值替换2x2邻域”。因此，在池化层中没有可以学习的参数。
完全连接的层：在完全连接的层中，所有输入单元对每个输出单元都有独立的权重。对于n输入和m输出，权数为n*m。此外，每个输出节点都有一个偏差，因此你需要使用(n+1)*m参数。
输出层：输出层是正常的全连接层，因此(n+1)*m参数为，其中，n是输入m数，是输出数。

最后的困难是第一个完全连接的层：我们不知道该层输入的维数，因为它是一个卷积层。要计算它，我们必须从输入图像的大小开始，并计算每个卷积层的大小。你的情况下，千层面已经为你计算了出来并报告了尺寸-这使我们很容易。如果你必须自己计算每个图层的大小，则要复杂一些：

在最简单的情况下（如你的示例），卷积层的输出大小为input_size - (filter_size - 1)，在你的情况下为：28-4 =24。这是由于卷积的性质所致：我们使用例如5x5邻域来计算点-但最外面的两个行和列没有5x5邻域，因此我们无法计算这些点的任何输出。这就是为什么我们的输出比输入小2 * 2 = 4行/列的原因。
如果不希望输出的大小小于输入的大小，则可以对图像进行零填充（使用padLasagne中卷积层的参数）。例如，如果在图像周围添加零的2行/列，则输出大小将为（28 + 4）-4 = 28。因此，在填充的情况下，输出大小为input_size + 2*padding - (filter_size -1)。
如果你要在卷积过程中明确地对图像进行下采样，则可以定义一个跨度，例如stride=2，这意味着你以2像素为步长移动滤镜。然后，表达式变为((input_size + 2*padding - filter_size)/stride) +1。

在你的情况下，完整的计算为：

  #  name                           size                 parameters
---  --------  -------------------------    ------------------------
  0  input                       1x28x28                           0
  1  conv2d1   (28-(5-1))=24 -> 32x24x24    (5*5*1+1)*32   =     832
  2  maxpool1                   32x12x12                           0
  3  conv2d2   (12-(3-1))=10 -> 32x10x10    (3*3*32+1)*32  =   9'248
  4  maxpool2                     32x5x5                           0
  5  dense                           256    (32*5*5+1)*256 = 205'056
  6  output                           10    (256+1)*10     =   2'570

因此，在你的网络中，你总共拥有832 + 9'248 + 205'056 + 2'570 = 217'706可学习的参数，这正是Lasagne报告的内容。

Waddas 2017-03-14 16:46:49

好答案，谢谢。我唯一仍然感到困惑的是如何计算卷积层大小。我不确定24x24和10x10的来源。

hbaderts 2017-03-15 07:36:44

我在卷积层中添加了有关大小计算的更多详细信息-如果这有帮助，请告诉我。

Raaj 2017-04-17 14:10:57

嗨@hbaderts，我还有另一个问题。根据你们这里的这张表，模型尺寸是指这里所有个体尺寸的总和，对吗？对于CNN，理解模型大小与可学习参数的数量成反比是否明智？请您看一下stackoverflow.com/questions/43443342/…吗？

Hunar 2018-11-28 08:27:30

@hbaderts，您的解释非常有帮助，但令我感到困惑的是，如果我有16个输出特征，为什么要处理偏差1 in（（n m l + 1）* k），所以偏差也将为16，是'是吗？所以我们必须在上面的公式中加上16？

hbaderts 2018-11-30 12:14:58

@ honar.cs如果您有16个输出功能，则k=16。等式为(n*m*l+1)*k，+1括号内为。因此，+1也要乘以16，n*m*l*16 + 16举一个例子。这有帮助吗？

deep learning-如何计算卷积神经网络的参数数量？

(deep learning - How to calculate the number of parameters for convolutional neural network?)

热门github