文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

CNN卷积函数Conv2D()各参数的含义及用法解读

2023-02-21 12:01

关注

首先我们放出tf2.0关于tf.keras.layers.Conv2D()函数的官方文档,然后逐一对每个参数的含义和用法进行解释:

tf.keras.layers.Conv2D(
    filters, kernel_size, strides=(1, 1), padding='valid', data_format=None,
    dilation_rate=(1, 1), activation=None, use_bias=True,
    kernel_initializer='glorot_uniform', bias_initializer='zeros',
    kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None,
    kernel_constraint=None, bias_constraint=None, **kwargs
)

从这个函数的定义能看出来,filters ,kernel_size过滤器个数和卷积核尺寸,这是两个位置参数,没有默认值,必须给。

后面的那个多参数,都是关键字参数(有等于号的),都是有默认值的,可以不写,下面来逐一分析每个参数的含义: 

1.函数的位置参数filters

这是第一个参数,位置是固定的,含义是过滤器个数,或者叫卷积核个数,这个与卷积后的输出通道数一样,比如下面filters为5的时候,卷积输出的通道数(最后一位)就是5

卷积核个数

filters卷积核个数为8的时候,输出的通道数就是8

卷积核个数

2.函数的第二个位置参数 kernel_size

卷积核尺寸,一般为3×3,或者5×5,此处用2个整数的元组或列表表示,比如(3,3),[5,5],如果height, width长宽一样,直接用一个整数表示就行,比如3或者5,卷积后的,卷积后的height,width的计算公式如下:滑动步长为strides,卷积核的尺寸为S,输入的尺寸为P,padding = ‘valid“

height =width = (P-S)/strides +1,

此处 输入形状为20×20,卷积核为3×3,滑动步长为1,所以输出为(20-3)/1 +1 =18

卷积核计算

此处,输入为20×20,卷积核为5×5,滑动步长为2×2,所以输出的形状为,(20-5)/2 +1向下取整,等于8,

卷积核

3.关键字参数strides=(1, 1),滑动步长

默认横向和纵向滑动均为1,这个与上面的 卷积核size配合使用,用来计算输出的形状,

height =width = (P-S)/strides +1,

4.关键字参数padding = “valid”

默认是边缘不填充

此处只有两个取值,另一个取值为 “same”,表示边缘用0填充,如果padding =“same”,则输出的形状为 height =width = P/strides ,向上取整,如下图,

全0填充后

5.关键字参数 data_format = ’ channels_first’

输入的数据格式

此处只有两个取值 ,“channels_first”,和“channels_last”,即输入的数据格式中,通道数是第一个还是最后一个,默认为“channels_last”,即默认输入数据的格式中,通道数为最后一个。

当data_format = "channels_first"的时候,输入和输出的shape格式为

(batch_size, channels, height, width)即(图片数量,通道数,长,宽)正如下图所示:

通道数格式

6.关键字参数dalition_rate = (1,1)

这个含义是卷积核的膨胀系数,

此处的作用是将卷积核进行形状膨胀,新的位置用0填充,新卷积核的尺寸和膨胀系数的计算公式如下:

原卷积核的尺寸为S ,膨胀系数为k,则膨胀后的卷积核尺寸为

size = k×(S-1)+1

卷积核膨胀系数

7.关键字参数activation = “relu”

此处的含义是激活函数,

相当于经过卷积输出后,在经过一次激活函数,常见的激活函数有relu,softmax,selu,等

8.关键字参数use_bias =0 、1

偏置项

此处取值为布尔值,0或者1,0表示没有增加bias,1表示有。

9.后面的关键字参数一般不常用

这几个参数不常用,

10.最后还有几个可选 的关键字参数

input_shape

这个是指输入的形状,一般是4D的,(batch size, height, width, channels),也可以不定义,那就是默认输入的形状。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯